在线上真假新闻的传播:谎言的传播速度快于真相

2020-12-11 11:11:43

Warning: Can only detect less than 5000 characters

Warning: Can only detect less than 5000 characters

信息论和贝叶斯决策论提出了另一种解释。新奇吸引了人们的注意力(24),有助于生产决策(25),并鼓励信息共享(26),因为新奇更新了我们对世界的理解。当信息是新颖的时,从信息理论的观点[因为它为决策提供最大的帮助(25)]和​​从社会的观点[因为它传达了社会地位],这不仅令人惊讶,而且更有价值。在“已知”或可以访问唯一“内部”信息的位置(26)]。因此,我们测试了虚假性是否比真相更新颖,以及Twitter用户是否更可能转推更新颖的信息。

为了评估新颖性,我们随机选择了约5000名传播真假谣言的用户,并在决定转推谣言之前的60天内抽取了大约25,000条推文的随机样本。然后,我们指定了一个潜在的Dirichlet分配主题模型(27个),其中包含200个主题,并接受了1000万条英语推文的训练,以计算该推文推文与用户在转发该推文推文之前所接触的所有先前推文之间的信息距离。 。这为我们数据集中的每个推文生成了200个主题的概率分布。然后,我们通过比较谣言推文的主题分布与用户在转发前60天内接触到的推文的主题分布,来衡量真实和错误谣言中的信息有多新颖。我们发现,在所有新颖性指标上,虚假谣言都比真实情况新颖得多,显示出明显更高的信息唯一性(KS检验= 0.457,P〜0.0)(28),Kullback-Leibler(KL)差异(KS检验= 0.433,P) 〜0.0)(29)和Bhattacharyya距离(KS test = 0.415,P〜0.0)(与Hellinger距离相似)(30)。最后两个指标测量代表传入推文的主题内容的概率分布与用户所接触的先前推文的语料库之间的差异。

尽管错误的谣言比真实的谣言可衡量地新颖得多,但用户可能并没有这样认为。因此,我们通过比较对真假谣言的情感内容,评估了用户对真假谣言所包含信息的看法。我们使用加拿大国家研究委员会(NRC)策划的主要词典对答复中的情感进行了分类,该词典根据Plutchik(31)在基本情感方面的工作提供了约140,000个英语单词及其与八种情感的关联的完整列表,愤怒,恐惧,期待,信任,惊奇,悲伤,喜悦和厌恶(32),以及约32,000个Twitter主题标签及其具有相同情感的加权关联(33)。我们从回复推文中删除了停用词和URL,并计算了推文中与八种情感中的每一种相关的词的比例,从而为每个回复创建了一个情感权重向量,这些情感权重总计为一个情感。我们发现,虚假谣言激发了表示更大惊喜的答复(KS检验= 0.205,P〜0.0),证实了新奇假设和更大的厌恶感(KS检验= 0.102,P〜0.0),而真相则激发了表达更悲伤的答复( KS检验= 0.037,P〜0.0),预期(KS检验= 0.038,P〜0.0),喜悦(KS检验= 0.061,P〜0.0),信任度(KS检验= 0.060,P〜0.0)(图4 ,D和F)。回应虚假信息而表达的情感可能会激发出新颖性之外的其他因素,这些因素会激发人们分享虚假新闻。尽管我们不能断言新颖性会导致转发,或者新颖性是虚假新闻被更频繁转发的唯一原因,但我们的确发现虚假新闻更加新颖,新颖信息也更可能被转发。

大量的诊断统计数据和操作检查验证了我们的结果并确认了其可靠性。首先,由于对于每个真假谣言都有多个级联,因此与对应于同一谣言的级联相关联的方差和错误项将相关。因此,我们指定了聚类稳健的标准误差,并计算了在谣言级别聚类的所有方差统计信息。我们通过比较有无聚类错误和无聚类错误的分析,测试了我们的发现对本规范的鲁棒性,并发现,尽管聚类降低了我们的估计精度,但结果的方向,大小和重要性没有改变,并且平方(P〜0.0)和偏差(d)拟合优度检验(d = 3.4649×10 –6,P〜1.0)表示

......