不对称的景观:蓝色新闻与红色新闻的不同形态

2020-09-16 22:43:43

这是关于Bluwhitered.org的一系列帖子中的第二篇,Bluwhitered.org是一个旨在帮助正确看待新闻的媒体分析工具。要从头开始,请转到这里。

从本质上讲,我是一名工程师和数据极客。因此,当我看到Bluwhitered.org上积累的所有可爱的结构化数据时,我想做的第一件事就是构建一组图表来理解新闻的形状。但出于耐心、统计学意义和避免偏见的考虑,我强迫自己等到我有足够的三个月时间后才把Tableau弄出来。

当我阅读BWR时,我大脑的数量部分总是问一些恼人的问题,比如:偏向光谱上有没有一种特定的颜色,发布了压倒性的内容,并扭曲了数据集?两边的“重心”是对称的还是不对称的?蓝色和红色是彼此的镜像,还是有很大的不同?

这一点很重要,因为重复强化了信念--如果你不断听到一个陈述,特别是来自多个出版物的陈述,它就会在你的头脑中获得可信度。我听用户用BWR描述的一种常见体验是,如果一个新闻故事由多个新闻来源报道,那么它会更真实。因此,值得关注的是整个数据集到底是蓝是红,是否存在任何固有的不平衡,以及其中可以辨别出哪些形状。再说一次-这是100天的数据-不足以得出任何广泛的全面结论,但一些模式是可以辨别出来的。

在我们开始之前,如果您不熟悉BWR的工作原理,我们先简要介绍一下(如果您感兴趣,这里有更详细的解释)。根据该消息来源典型的历史政治偏见(由中立的第三方评级),新闻故事被分为最蓝、白、红、红和最红。在宽泛的笔触中,蓝色和蓝色是左倾,蓝色、白色和红色是更中间的,红色和红色是更右倾的。完整的偏移谱如下所示:

BWR主要对与美国政治相关的新闻感兴趣,因此它使用“政治”、“政府”、“选举”、“特朗普”和“拜登”等关键词进行搜索。它还在寻找有很多人阅读的新闻,所以它会过滤掉所有Facebook点赞数低于10k的故事,BWR将其定义为受欢迎的门槛。

那么,对于100天的数据,转化为约18,500个新闻故事,我们查看了多少来源,它们如何符合偏差光谱?

显而易见的是,在这段时间发表流行故事的大约150个来源中,几乎有一半是蓝色的。他们中的许多人是国际消息来源,在报道美国新闻时,这些消息往往显得略带蓝色。“今日俄罗斯”是一个明显的例外,它牢牢地站在最红的区域。

当我们看到每个Source发布的故事数量(获得了10k个或更多Facebook赞)时,情况会发生怎样的变化?

被归类为“白色”的内容很少超过受欢迎的门槛-与“白色”来源的数量相比,占总内容的比例要低得多。如果你经常阅读BWR,这不会让你感到惊讶--关于几个主题的“白色”专栏经常是空的。(这是在大屏幕上查看BWR时,所有7列都可见-手机上的折叠视图有3列,蓝色、白色和红色折叠为一列白色。)。当然,这在一定程度上是由于消息来源的数量,但也许这也意味着对一个话题采取更中立的态度不太受欢迎?

蓝色故事占总数的一半以上-所以蓝色来源在发表的故事数量上超出了它们的份量,在某种程度上,它是BWR上最大的单一故事类别。这会不会是造成“主流媒体”左倾的一个因素呢?被归类为蓝色来源的“纽约时报”似乎屏蔽了我使用的新闻爬虫服务,所以图表中没有纽约时报的数据点,BWR上也没有纽约时报的新闻。如果他们做到了,这将使蓝色的主导地位更加明显,特别是与红色类别(与福布斯和华尔街日报)相比,红色类别的大小不到蓝色的五分之一。造成这些情况的另一个因素是,像“华尔街日报”(和“纽约时报”)这样的网站是在付费墙后面的,因此可能比免费网站拥有的读者更少。

右上角的蓝色和红色大小相似,分别由CNN和福克斯新闻主导,在整个光谱中提供了唯一的相对对称点。蓝色比红色大约20%,但它的大小比其他的要接近。

在光谱的最远端,最红的是最蓝的4倍多,主要是布莱巴特和火焰。相比之下,最蓝的同行赫芬顿邮报(Huffington Post)和Vox相形见绌。

这是一个典型的非对称双模式分布:总体上以蓝色为主,并且比红色大得多。最红的占主导地位,最蓝的占主导地位。红色和蓝色的大小差不多,而白色在一定程度上是最小的。这意味着总体中间带位于中心左侧,并且红色中间带比蓝色中间带离分布中心更远。在这篇文章的末尾有更多关于这方面的信息。

一句话,是。人气分布的形状与Volume非常相似,但有一个例外:虽然Blue Stories比Red多了约20%,但Blue Like只比Red多了约5%(请注意,右上角的块现在大小更接近了)。这意味着平均而言,红色故事比蓝色故事在Facebook上获得了更多的赞。

我已经在每个类别中突出了一些最受欢迎的故事-这里有很多关于故事内容的挖掘,我将在未来的帖子中这样做。现在,让我们把重点放在整体形状和大局上。

对于不太嘈杂的图片,我已经去掉了一次性的-所以只有达到受欢迎门槛的5个或更多故事的来源才会出现在这个图表中。与显示的组相比,这将修剪Y轴上和下的一些(<;10)异常值。

福克斯新闻(Fox News)和美国有线电视新闻网(CNN)本身就属于一个类别--多产的新闻机器,每天炮制出超过15篇报道,达到了10000个Facebook赞的人气门槛,平均每篇报道获得35000个Facebook赞。

每天有5-15个故事是8个蓝色来源加上布莱巴特、火焰和MSNBC。这片“蓝云”在BWR上占据了相当大的篇幅。

每天3-5篇报道是较小的“红色/红色云”,其中包括“福布斯”和“每日来电”,外加两个蓝色消息来源和“赫芬顿邮报”。包的其余部分是混合的,考虑到它们在总数中所占的比例如此之大,蓝色来源占主导地位。

值得注意的是,这些资源每天都可能产生更多的故事--这些数字仅仅是那些突破了10k Facebook赞受欢迎门槛的数据。

说到受欢迎程度,让我们更广泛地看看Facebook上的参与度-点赞、分享和评论。

再一次,为了避免一次性,我剔除了不到5个故事的离群值,这些故事在这里达到了受欢迎的门槛。

因此,值得注意的是,在那之后仍然显示为异常值的来源。南佛罗里达太阳哨兵报(Redish)的分享和评论激增,Alternet(Bluest)的赞和分享激增。

其他一些趋势也是显而易见的。在点赞方面,从左到右似乎有轻微的下降趋势,这意味着与红/红/最红的来源相比,最蓝/蓝/蓝的来源平均获得了更多的喜欢。

在股票方面,这一趋势看起来几乎持平,表明波动较小。在评论上,这一趋势正好相反,从左到右略有上升。这意味着平均而言,红/蓝。

这是一个相对较小的数据集,但在更红的来源上的评论占主导地位,会不会助长了人们对Facebook是“右翼回音室”的看法?

我们在周末看到了淡静,周中的新闻也出现了激增。6月初(当时出现了全国性的抗议活动,以回应乔治·弗洛伊德(George Floyd)被杀事件)对于蓝色消息来源来说,这是一个相对沉重的新闻月。关于这一点的更深入的分析-特别是涉及范围内覆盖最多和最少的主题-将在稍后的帖子中发布。

在不同的偏向类别中,与星期几相关的新闻周期机制似乎是相同的。

当查看Source发表的故事数量时,有一个明显的不对称。整体中位数位于偏置光谱中间的左侧,当分别观察蓝色和红色时,红色中值比蓝色中值距离偏置光谱的中间位置更远。在BWR上,蓝色类别的内容占到了一半以上。

这种不对称性与通过Facebook点赞衡量的故事受欢迎程度密切相关,主要区别在于,仅就红色和蓝色类别而言,红色故事平均比蓝色故事获得更多的赞。

当从更广泛的角度看Facebook的参与度时,Bluest/Blue/Bluish来源平均比Redish/Red/Redest来源获得更多的赞。对于评论来说,这一趋势正好相反,平均而言,Redish/Red/Redest来源比Bluest/Blue/Bluish来源获得了更多的评论。在偏向范围内,股票似乎相对持平。

在流行内容的数量上,CNN和福克斯各自在一个类别中,在下一个最大的玩家之前有很大的差距。

随着时间的推移,似乎没有按偏见类别进行巨大的变化或倾斜,成交量遵循典型的每周新闻周期。

我们还没有讨论这些故事中每个故事的内容--这本身就是一个引人入胜的故事--将在未来的帖子中发表。如果您感兴趣,请关注我们的最新消息,当价格上涨时,您将是第一个听到消息的人。

在那之前,继续阅读BWR,并对你周围的世界做出自己的决定。