Facebook有一个超级用户至上的问题

2022-02-13 13:45:20

我想理解为什么Facebook经常是仇恨和虚假信息的粪池,一个好的起点是与约翰、米歇尔和卡尔文这样的用户打交道。

来自纽约州北部的约翰是一名戴帽子的狂热者,他称众议院议长南希·佩洛西为“皮格罗西”,使用了“黑人”这个词,并表示对与他们意见相左的民主党人的正确反应是“枪毙所有人”米歇尔反对“计划主义”卡尔文用“同性恋”作为污蔑,并宣称黑人社区永远是“垃圾场”你几乎肯定在网上遇到过这样的人。然而,你可能没有意识到的是,它们有多么强大。

一年多来,我们一直在分析一个庞大的新数据集,我们设计该数据集来研究500个美国Facebook页面上的公众行为,这些页面获得了用户最多的参与度。我们的部分研究将于今年晚些时候提交同行评审,目的是更好地了解在Facebook上传播仇恨和错误信息的人。我们希望了解他们如何使用这个平台,最重要的是,Facebook如何应对。根据之前的报道,我们预计情况会很糟糕。我们发现的情况更糟。

我们的发现中最令人震惊的一点是,像约翰、米歇尔和卡尔文这样的人不仅仅是边缘巨魔,或者是平台上真正重要的东西的分心者。他们是一个精英阶层的一部分,以前没有被报道过,这个阶层的用户比美国99%的Facebook用户产生更多的喜欢、分享、反应、评论和帖子。

他们是超级用户。由于Facebook的算法奖励参与度,这些超级用户对哪些帖子最先出现在其他用户的订阅源中,哪些帖子根本看不到有巨大的影响力。更令人震惊的是,这些超级有影响力的用户中,大多数人都是多么的讨厌。事实证明,Facebook上虐待行为最严重的人被赋予了塑造Facebook的最大权力。

F远比大多数人意识到的更集中。该公司喜欢强调其平台的广度:每月近29亿活跃用户,访问数百万公共页面和群组。这是误导。我们的分析表明,公共活动集中在一组非常狭窄的页面和组上,用户的数量要少得多。

本·夏皮罗(Ben Shapiro)、福克斯新闻(Fox News)和占领民主党(Occuple Democratics)等热门页面每月在我们的数据中产生数千万次互动,而所有美国页面在参与度方面排名300或更低的页面,每个页面收到的互动都不到100万次。(参与度最高的页面包括极右翼和极左翼的例子,但在排名靠前的公开政治页面中,右翼页面占主导地位。)这些赢家在许多其他领域都能看到模式的镜子,比如几本畅销书的主导地位,或者几十家大型蓝筹股公司在标准普尔市场总市值中的主导地位;第500页。不过,在Facebook上,人们并没有广泛了解人们对几个超流行页面的关注。

我们分析了2020年夏季平均参与率最高的500个美国运营页面中两个月的公共活动。排名靠前的页面倾向于政治,但该榜单也包括其他广泛主题的页面:动物、日常动机、基督教信仰内容、烹饪和手工艺,当然还有新闻、体育和娱乐。前500名的用户参与度急剧下降,而且以统计规律的方式,我们估计这500个页面在该平台上占美国公众页面参与度的一半左右。(我们利用非营利组织霍普韦尔基金会(Hopewell Fund)的资助进行了研究,该基金会是向进步事业分发匿名捐款的组织网络的一部分。霍普韦尔的官员没有以任何方式参与我们的研究,也没有参与评估或批准我们的结论。我们获得的资助与任何政治活动无关。)相反,se是一个项目的一部分,该项目致力于支持研究人员研究社交网络上的错误信息和责任。)

公共团体在几个方面与网页不同。网页通常代表组织或公众人物,只有管理员才能在其上发布内容,而群组就像是任何用户都可以发布的老式互联网论坛。因此,群体往往有更高的帖子数量、更多的评论、更少的喜欢和分享,但他们也遵循赢家通吃的模式,尽管这种模式不那么极端。

由于群组帖子的数量要大得多,我们在2020年同一个两个月的时间框架内,在两周的时间里对群组进行了更深入的分析,查看了来自41000多个美国会员人数最多的公共团体的数千万条互动度最高的帖子。

总体而言,我们观察到5200万用户活跃在这些美国页面和公共团体上,不到Facebook声称的美国用户群的四分之一。在这些公开活跃的少数用户中,前1%的用户负责所有观察到的交互的35%;前3%的人占52%。许多用户似乎很少与公共群组或页面进行交互。

尽管这些数字存在偏差,但它们仍然低估了超级用户的主导地位。Facebook用户遵循一致的参与阶梯。公众活动较少的用户绝大多数只做一件事:他们喜欢在最受欢迎的页面上发表一两篇帖子。随着活动的增加,用户进行更多类型的公共参与,添加分享、反应,然后添加评论,并扩展到最受欢迎的页面和组之外。当我们查看越来越小的页面和组时,我们发现他们越来越多的参与来自最狂热的用户。因此,对我们错过的较小页面和最小群体的全面报道将描绘出一幅超级用户至上的更加鲜明的画面。

超级用户的主导地位有着巨大的影响,不仅仅是我们最初对虐待用户的担忧。或许,来自前Facebook数据工程师弗朗西斯·豪根(Frances Haugen)的大量内部文件的最重要启示,涉及Facebook关键算法的内部工作,称为“有意义的社交互动”(MSI)。Facebook在2018年推出MSI,当时它正面临着整个平台参与度下降的问题,扎克伯格称赞这一变化是帮助“与我们关心的人建立联系”的一种方式据报道,Facebook将员工的奖金与该措施挂钩。

MSI的基本原理很简单:它通过为不同的公共互动分配点数来对帖子进行排名。含有大量MSI的帖子往往会出现在用户新闻源的顶部,而含有少量MSI的帖子通常根本看不到。据《华尔街日报》报道,当MSI首次在平台上推出时,“like”值一分;反应和再分享价值5分;“不重要”的评论得15分;“重要”的评论或信息价值30英镑。

像MSI这样的指标,对评论等不太频繁的行为给予了更大的权重,对更小的用户群产生了影响。使用《华尔街日报》引用的值,并从豪根的文件中提取数据,我们估计,在我们观察到的页面和群组中,排名前1%的公众可见用户会产生大约45%的MSI,加上或减去两个百分点取决于什么是“重要”评论。根据描述其推理的内部消息,马克·扎克伯格最初否决了Facebook诚信团队提出的对新闻提要的修改,因为他担心MSI较低。然而,由于活动如此集中,这实际上让过度活跃的用户否决了原本可以控制自己滥用的政策。

我们的数据表明,美国顶级页面上的MSI大部分来自Facebook声称在美国拥有的2.3亿多用户中的约70万用户。Facebook拒绝回答我们关于本文的问题,相反,他提供了这样的声明:“虽然我们无法对我们没有看到的研究发表评论,但与我们分享的小部分内容并不准确,似乎从根本上误解了新闻提要的工作原理。排名是针对我们预测的每个人想看的内容而优化的,而不是针对最活跃的用户所做的。”

撇开Facebook的评论不谈,有充分的证据表明,该公司长期以来一直将朋友和普通用户的活动作为“用户希望看到什么”的关键预测指标,特别是MSI一直是扎克伯格的“北极星”各种报道显示Facebook如何反复调整不同MSI组件的权重,比如反应表情符号。最初的5分,他们被降到了4分,然后是1.5分,然后喜欢和爱被提升到了2分,而愤怒表情符号的权重被降到了零。正如《大西洋月刊》去年首次报道的那样,内部文件显示,Facebook的工程师们表示,他们发现,减少“愤怒”的分量意味着仇恨言论和错误信息的大幅减少。Facebook表示,它在2020年秋季实现了永久性的改变。2020年1月的一封内部电子邮件称,Facebook正在推出一项改变,以减少陌生人对MSI指标的影响。

我们的研究显示了一些不同的东西:所有这些调整都不会改变大局。产生最多公众反应的用户也会产生最多的喜欢、分享和评论,因此重新加权只会稍微调整哪些最活跃的用户更重要。现在我们可以看到,有害行为主要来自超级用户,这一点非常清楚:只要把不同类型的参与加起来仍然是Facebook推荐系统的一个关键组成部分,它就放大了同一个极端狭窄、基本上令人憎恶的用户的选择。

那么这些人是谁?为了回答这个问题,我们随机抽样调查了3万名用户,在我们观察到的参与这些页面和公共团体的5200多万用户中。我们重点关注了300个最活跃的互动,那些在他们的喜欢、分享、反应、评论和群帖总数中处于前百分位的人。我们根据这些账户的公共档案信息和图片对其进行了审查,结果显示,这些顶级用户倾向于白人、老年人,尤其是男性虐待用户。30岁以下的用户基本上没有。

因为前300名都是重度用户,其中四分之三的人在我们两个月的时间里留下了至少20条公开评论,有些人留下了数千条。我们尽可能多地阅读了他们的评论,总共超过8万条。

在219个至少有25条公开评论的账户中,68%传播错误信息,以垃圾邮件的方式转发,发表种族主义或性别歧视或反犹太主义或反同性恋的评论,希望对他们所认识的敌人施加暴力,或者在大多数情况下,对上述几个人施加暴力。即使有6%的误差幅度,很明显大多数最活跃的用户都是有毒的。

顶级用户发布了大量令人眼花缭乱、自相矛盾的错误信息。许多人断言,新冠病毒不存在,大流行是一种有计划的大规模谋杀,或者是一个精心策划的阴谋,通过比尔·盖茨的“杀手疫苗接种计划”将人群植入芯片。这些用户一次又一次地宣称,疫苗会致命,口罩会让你生病,羟氯喹和锌可以修复一切。我们遇到的错误信息并不全是关于CVID-19的谎言,关于1000以上的评论出现了大规模选民欺诈。

种族主义、性别歧视、反犹太主义和反移民言论不断出现。女性民主党政客,尤其是黑人,被反复称为“婊子”,甚至更糟。关于政治人物的辱骂和非人化言论随处可见,卡农式的信仰也是如此,即世界是由国际儿童性贩运者的秘密阴谋集团管理的。

除了滔滔不绝的恶意帖子外,数十名顶级用户还以垃圾邮件的方式行事。在我们的数据中,我们看不到机器人或非人类账户的大规模证据,评论历来是最难大规模伪造的活动。但我们确实看到许多账户在不同页面上的许多帖子上复制和粘贴相同的RANT。其他账户反复发布了同一错误信息视频或假新闻网站的链接。许多账户也会重复一两个词的评论,通常简单到“是”或“是!!”-几十次,对大多数用户来说,这是一种不寻常的行为。无论这种行为是否协调一致,这些一次性评论都极大地促进了MSI,并向Facebook的算法发出了这是用户希望看到的信息的信号。

在许多情况下,这种错误信息和仇恨的有毒混合最终导致了对政治暴力的幻想。许多人想射杀、碾压、绞死、焚烧或炸毁黑人抗议者、“非法者”或国会民主党议员。他们通常用种族主义谎言或关于反种族主义的虚构说法为这种暴力辩护。许多顶级用户吹嘘说,他们已经为看似不可避免的暴力做好了准备,他们正在购买枪支,枪支“上锁上膛”

这些令人不安的言论不仅仅是空谈:许多被指控参与1月6日美国国会大厦袭击的人也出现在我们的数据中。我们能够将前380名被指控的个人连接到210个Facebook账户;其中123条在我们的数据集构建期间公开活跃,51条评论总共超过1200条。这些评论的内容反映了前1%的用户的辱骂语言,进一步说明了假装有害用户只是普通用户群中的几个坏蛋的风险。

R随着时间的推移而改变,Facebook对其内部运作的保密性是出了名的。我们的研究捕捉到了该平台的一个重要但仍然有限的快照。但只要用户参与度仍然是Facebook推荐内容的最重要因素,它就会继续给最差的用户最大的影响力。如果美国的情况如此糟糕,Facebook的温和努力在美国最为活跃,那么其他地方的情况可能会更糟。

允许一小群行为恶劣的人主宰这个平台是Facebook的选择,而不是不可避免的。如果Facebook的15000名美国版主中的每一位都积极审查了几十名最活跃的用户,并永久删除了那些屡次违规的用户,那么Facebook上的滥用行为将在几天内大幅下降。但总体用户参与度也是如此。

也许这就是为什么我们发现Facebook很少采取行动,即使是针对最严重的违规者。在我们的样本中,150个明显存在虐待行为的账户中,只有7个在一年后被暂停。Facebook可能会公开谴责那些发布仇恨、传播错误信息和渴望暴力的用户。不过,私下里,数十万名惯犯仍然是Facebook上最重要的人物之一。