大多数社交媒体用户都知道,BOT账户就在我们中间,无论是作为大声疾呼的假选民,还是痴迷于转发单一公司内容的人。然而,在辨别许多“假”账户与真实账户--或者仅仅是知道有多少非个人在网上活跃--时,即使是精明的用户也大多一无所知。
统计数据显示,世界上有超过30亿社交媒体用户,其中许多人在多个平台上拥有账户。社交媒体账号的总数可能是这个数字的几倍,这使得将人们(以及他们更勇敢/更淫荡/更性感的在线自我)与商业、政治和一般的超级网游账号区分开来的任务成为一项巨大的技术挑战。根据我们请来的专家在本周的“吉兹问答”中所说,要确定谁是真的,谁是假的几乎是不可能的,但有几件事是热血的网民可以注意的。
印第安纳大学网络科学研究所复杂网络和系统研究中心信息学和计算机科学教授。
我建议你参考我们中心的论文,我们估计9%到15%的活跃Twitter账户可能是社交机器人,这意味着85%到91%是人类。当然,这些是基于各种假设的估计,但我相信这是我们目前拥有的最好的估计。你可能听说过15%的数字,因为这个数字在媒体上被广泛引用。
在TwitterAudit,我们在过去六年中分析了数千万Twitter用户。我们已经调整了我们的算法来识别僵尸模式,区分假账户和真实账户。根据我们的数据,我们估计40-60%的Twitter账户代表真人。与其他社交媒体平台相比,在Twitter上注册一个虚假/BOT账户要容易得多,而且在许多情况下,很难区分一个账户是假的还是不活跃的。另一方面,在Twitter上定义一个“真人”要比在Instagram上定义一个“真人”容易得多。
简而言之,我们不知道答案。在某种程度上,几乎每个社交媒体账户背后都有一个人在背后创建和操作它,即使他们所做的一切只是将其预先编程为一个机器人。
有多少社交媒体账户属于他们声称的那个人?有数以百万计的人不知道。还有一些巨魔账户冒充别人。有一些机器人账户使用别人的头像和名字,但每天会自动发布数百次。有一些账户过去是由真正的用户管理的,但后来被别人劫持并接管了。有一些账户自称是一个人,但却是由一个团队操作的。有一些电子人账户,有时发布创作的内容,有时发布自动驾驶,没有人工干预。
这就是为什么在点击之前思考是如此重要的原因。你不能以表面价值来看待每个账户:不同的人会运行模拟账户来产生政治影响,或者传播垃圾邮件和恶意软件,或者仅仅是为了制造麻烦的乐趣。在您与客户接洽之前,查看其行为方式总是值得的。
在我看来,要估计社交网络上的真实账号数量是极其困难的。事实证明,当你只有推文或Facebook消息时,很难判断作者是机器人、微博用户,还是圣彼得堡的某个冒充明尼苏达州家庭主妇的人。
事实上,有这么多种类的账户不是真人,这使得区分任务变得更加困难。例如,有简单的关注者机器人(如果你需要虚假关注者就会购买;旨在增加关注者数量,只发布随机内容)、转发机器人(设计用于传播内容)、新闻馈送机器人(设计用于发布推文,例如来自新闻网站的标题),以及设计用于与发布特定内容的人互动的机器人(例如@yesyour eracist)。
最好的机器人以一种聪明的方式复制人类用户的内容,并根据日常节奏发布内容,等等(我几年前就做了一些这样的事情)。即使对于专家来说,这些描述也几乎不可能与人类区分开来。
我们甚至没有涵盖人类用户在社交媒体上出于恶意目的冒充他人的类别,比如传播虚假信息。
Facebook和Twitter等平台所有者可能对寻找机器人并不真正感兴趣,这加剧了识别属于真人的账户的问题。他们拥有的用户越多,他们赚的钱就越多。
我要说的是,在对虚拟世界“第二人生”的378名“居民”的调查中,我和我的合著者发现,居民平均报告了两个化身账户(具体地说,是2.45;标准差=3.58)。虽然58%的居民报告只有一个主要化身帐户,但42%的居民报告了替代帐户;每个居民的平均帐户数量和高标准偏差可能是因为少数居民拥有大量的帐户(例如,5到10个)。
虚拟世界与社交媒体网站不同,可以说是因为它们的身临其境和不同的活动范围。然而,如果Second Life上的账户创建行为与Facebook和Twitter等社交媒体网站上的账户创建行为相当,那么很可能很多人有一个主要账户,一些人有第二个备用账户,而少数人有大量的替代账户。
很难确定社交媒体平台上真实用户的具体数量,但消费者应该意识到,机器人比许多人预期的要普遍得多。例如,2017年10月,推特在国会作证称,约5%的账户由机器人运营,然而一些研究显示,这一数字高达15%。
机器人是任何被设计来执行特定任务的自动化工具或脚本,可以在社交媒体上使用来放大一个人的议程,使其看起来比实际情况更广泛。特别是政治机器人,可以用来夸大政客的人气,操纵公共谈话。通过倾斜公共话语的规模,社交媒体在影响个人观点和商业决策方面拥有前所未有的力量。
然而,社交媒体平台允许这个问题持续存在是有原因的。社交媒体公司和大多数企业一样,向投资者或股东报告,他们觉得有责任不断报告活跃用户数量的增长,以此作为衡量成功的标准。这些公司已经开始在他们的用户增长报告中包括机器人。因此,随着时间的推移,社交媒体公司开始过滤非人类账户变得越来越困难。虽然它可以提供对真实用户的准确观察,但它可能不会显示出他们希望或承诺的增长。随着社交媒体公司继续经历市场的积极强化,它们被留下了一种不正当的动机,以避免正面监管BOT问题。
那么解决这个问题的答案是什么呢?需要技术和立法的结合。虽然立法肯定有助于揭露每个受机器人困扰的行业的问题,并有助于提供一些正义,但仅靠法律是无法阻止黑客和欺诈者的。能够阻止坏机器人甚至到达网站的技术也可以解决这个问题,但两者需要合作。
虚假账户是对社交网络的生死存亡的威胁。社交网络的意义在于与真实的人互动,并参与合法的内容;一旦这一点受到质疑,参与度就会直线下降。如果我们看看Facebook和Twitter公开报道的情况,从历史上看,虚假社交账户的可能范围在15%-25%的用户之间。
因为身份系统在很大程度上是基于互联网之前的旧模式,所以在网上隐藏一个人的身份是微不足道的。想想看,在现实世界中,我们的身份系统是一张卡:它是你的驾照或护照。一个人类看着它说,“哦,是的,你看起来是合法的。”认为“这张卡不是假的。”这在很大程度上是因为人类擅长判断ID是否与站在他们前面的人匹配。
在网上,“驾照”的概念并不存在。匿名性是当今在线体验的一个基本现实。ID/PW组合本身并不能解决匿名问题,所以社交网络引入了我们所说的“天真摩擦”,如验证码、电子邮件、短信和电话验证。我们称这些为“幼稚”,因为它们的用意是好的,但实际上却阻止了合法用户,而不是恶意用户。
验证用户帐户的新方法是部署一个可以模仿人类直觉的系统。这个系统不是查看驾照或护照,而是同时查看账户和设置它的用户的内容和行为数据,并进行实时操作。这些数据提供了充足的线索来精确地预测给定的账户是否是假的。