本篇文章814字,读完约2分钟
世界上比酒后发短信更危险的事情是酒后发短信。公开广播你喝醉了显然不是一个应该采取的行动来扩大你的社交生活。然而,仍有许多人忍不住吹嘘自己饮酒后的越轨行为。科学家们为此伤透了他们的心。据国外媒体报道,科学家们已经训练了一套算法,可以识别“醉酒推文”,甚至可以知道他们在推文时是否饮酒。
据报道,美国罗彻斯特大学的研究员纳比尔·侯赛因(nabil hossain)决定将推特和机器学习结合起来,跟踪和监控特定群体中的醉酒用户和推特。
为了训练,nabil hossain从2013年7月到2014年7月收集了数千条加了标签的推文,然后筛选出包含与酗酒相关的关键词的推文。
随后,他们通过亚马逊土耳其机器人的众包服务混合了11000条推文,每条推文必须通过三个问题:
Q1:这条微博有没有酒精的迹象?
Q2:如果是这样的话,这条微博是关于那个喝醉的微博用户自己的吗?
问题3:如果是这样的话,是否有可能这些推文是在他们饮酒的时间和地点发送的?
侯赛因训练了三种不同的算法——“线性支持向量机”(SVM)——每个问题都有答案。
准确率(识别醉酒的推特)-机器学习和turkers结果的准确率-算法在回答q1时的准确率为92%,在回答q3时的准确率为82%。
然而,该团队进行了一项更深入的研究,试图找到推文的发送地点,无论是在家里还是其他地方。为了定位用户的推文,研究人员收集了一些与家庭相关的关键词,如洗澡、沙发、电视、睡觉和家,然后筛选推文。
用同样的训练方法,研究小组声称已经成功地创建了一套准确率为80%的算法来识别发送位置。
根据研究结果,该团队概述了纽约居民最喜欢的饮酒场所——家、俱乐部等等。这是一个有趣的发现,因为有了这些数据,研究人员可以描述一种模式。例如,纽约人喜欢在家附近喝酒,而其他地区的人喜欢在郊区喝酒。这样的统计可以反馈酒精饮料的消费场所。
“将来,我们可以利用这项技术在社交媒体上对饮酒进行全面研究。”