人工智能系统检测Facebook和Twitter上外国“巨魔”的帖子

2020-07-23 21:23:23

研究人员发现,通过查看帖子的时间和长度以及帖子包含的URL的线索,可以发现社交媒体上的外国操纵活动。

从2016年美国总统大选到英国退欧,越来越多的政治事件被认为是脸书、推特和Reddit等社交媒体平台上外国活动的目标。

现在,研究人员表示,他们已经开发出一种自动机器学习系统-一种人工智能-可以根据帖子的内容发现这些帖子。

普林斯顿大学的迈萨姆·阿里扎德博士(Meysam Alizadeh)是这项研究的合著者之一,他说:“我们可以使用机器学习来自动识别巨魔帖子的内容,并在没有人工干预的情况下跟踪在线信息操作。”

该团队表示,这种方法不同于简单地检测机器人,他们说,这一点很重要,因为这样的活动通常包括人类发布的帖子。他们说,在所谓的巨魔运动中发布的帖子数量巨大,这意味着可能需要标准的模板和操作程序。

该团队在“科学进展”(Science Advance)杂志上撰文,报告了他们是如何使用四个针对美国的已知社交媒体活动的帖子开展工作的,这些活动被归因于中国、俄罗斯和委内瑞拉。

该团队专注于2015年12月至2018年12月期间在Twitter上发布的巨魔帖子,以及2015年7月至2016年12月期间在Reddit上发布的巨魔帖子。

为了进行比较,他们还使用了数千个美国Twitter账户、参与美国政治的用户和普通用户的数据,以及数千个与外国操纵活动无关的Reddit账户的帖子。

在对系统进行数据子集培训后,团队探索了五个不同的问题。这些问题包括机器学习系统是否能够区分巨魔帖子和那些与正常活动相关的帖子,以及从一个月开始向系统提供巨魔帖子是否可以让系统发现新的巨魔账户在下个月发布的帖子。

结果表明,该方法效果良好,系统标记的帖子通常来自巨魔。然而,并不是所有的巨魔帖子都被系统识别出来了。

加的夫大学犯罪与安全研究所所长马丁·因尼斯教授说:“这是一项重要的、有趣的、有时还很耐人寻味的分析。”“机器学习算法应该能够从有限的数据集中识别出类似的内容,这或许是意料之中的,因为毕竟数据中已经有了使它们能够连接起来的信号。”但正如作者非常正确地澄清的那样,在‘野外’应用这些方法来识别‘活’行动方面,还有一个差距需要弥合。“。

该团队还发现,根据活动背后的国家,该系统的表现存在差异,中国的活动比俄罗斯的活动更容易发现。“就委内瑞拉的竞选活动而言,我们的表现近乎完美;接近99%的准确率,”Alizadeh说。

“就中国的表现而言,我们的表现在90%-91%左右。俄罗斯是最复杂、最复杂的战役:我们的表现在85%左右。

Alizadeh说,这并不意味着俄罗斯的信息参与者一定更善于与美国的常规用户打成一片。“他们擅长模仿推特上的美国政治用户,”他说。“但还有其他原因无法发现:例如,委内瑞拉人总是谈论政治。俄罗斯巨魔,他们中的一些人从来不谈论政治-他们参与标签游戏或分享下载音乐的链接。为什么俄罗斯巨魔要这么做?答案之一可能是建立自己的受众。“。

作者表示,这项工作还突显了外国竞选活动是如何随着时间的推移而改变策略的:例如,在俄罗斯的活动中,标签使用量在2015年末和2016年初达到峰值后有所下降。

Alizadeh说:“我们从一开始就有这样的想法,即开发一个公共仪表盘,记者和人们可以每天查看,以了解社交媒体上关于国内外信息业务的情况。”

这样的事情“将是保障我们民主的第一步。然后我们还应该把它推广到其他国家、其他民主国家和其他语言。“