与传统广播公司一样,社交媒体平台通过其算法选择要放大和抑制的故事。但是,与传统广播公司不同,社交媒体公司除了根据自己在平台上允许的语音类型不断变化的决定之外,不承担任何其他标准的责任。
而且他们的算法不是透明的。与晚间新闻广播不同,没有人可以看到他们决定将成为当天的头条新闻。没有两个人会在他们的个性化Feed中看到完全相同的内容。结果,独立团体很难跟踪诸如“ Plandemic”视频之类的错误信息的传播,该视频在被删除之前在Facebook和YouTube上均获得了数百万次观看。
因此,我们决定尝试通过将全国首个全国性用户小组聚在一起,以付费方式向社交媒体用户监视正在向社交媒体用户广播的内容,该小组将向我们分享其数据。我们从Facebook开始,每月有超过27亿的活跃用户。
我们构建了一个自定义的独立桌面应用程序,该应用程序分发给了1,000多名付费参与者的面板。这些小组成员向我们提供了有关他们自己的人口统计信息-性别,种族,位置,年龄,政治倾向和教育程度-并将公民浏览器应用程序连接到他们的个人Facebook帐户。该应用程序会定期从小组成员的Facebook供稿中捕获数据。
为了保护小组成员的隐私,我们会自动从其捕获的Facebook数据中删除潜在的标识符。我们从他们那里收集的原始数据永远不会被任何人看到,并且在一个月后会自动删除。
在编校过程之后,我们将链接,新闻文章以及推广的组和页面存储在数据库中以进行分析。我们通过应用程序收集的数据将与小组成员提供的人口统计和政治数据结合使用,以确定Facebook为不同的人提供哪些信息,放大哪些新闻和叙述以及鼓励人们加入哪些在线社区。应用程序,数据处理管道和底层云基础架构均由第三方安全研究公司Trail of Bits进行了审核。它进行了安全评估,并审查了我们的代码以安全处理小组成员数据的最佳做法。我们根据安全公司的建议采取了其他措施来保护用户数据。我们将在“编辑器”部分和附录2中更详细地描述这些隐私保护步骤。
根据皮尤研究中心(Pew Research)的最新研究,大约五分之一的美国人说,他们主要通过社交媒体获取政治新闻。但是,对于决定将哪些内容推荐给哪些人的算法的运作知之甚少。
Facebook公开了有关其算法工作原理的一些一般原则:它说,它根据发布者的内容,内容的类型以及发布是否吸引了很多份额和反应来对内容进行优先级排序。但是它不允许在其平台上进行大量独立研究。
在Cambridge Analytica之后,Facebook在其核心Facebook Open Graph开发人员API的使用上增加了全面的限制,并增加了使用人工审核来批准开发人员应用程序的使用。例如,仅在几年前,很容易在Facebook上的任何页面上收集公开帖子(这是在平台上跟踪新闻来源的重要方式),但是此后,可用性一直仅限于有关以下内容的顶级元数据公开页面。
2018年,Facebook宣布与哈佛大学“社会科学一号”的独立学术研究人员合作。 Facebook承诺与研究人员共享超过PB的数据,研究人员的建议已被独立委员会接受。但经过18个多月的延迟,Facebook没有兑现其承诺。相反,研究人员可以访问极为有限的数据集和Facebook拥有的社交分析公司CrowdTangle。针对这些缺陷,该项目的共同主席写道,“目前的状况是站不住脚的”,并且慈善合作伙伴开始退出该项目。
2020年,Facebook宣布了一项新的研究合作伙伴关系,以更好地了解Facebook和Instagram在美国2020年选举期间对关键政治态度和行为的影响,《社会科学一号》(Social Science One)促进了该项目的启动。 Facebook表示,预计这项研究最早要到2021年中旬才能发表。
Facebook提供给记者和研究人员了解其平台模式的主要来源是CrowdTangle,它于2016年购买。CrowdTangle提供了Facebook和Instagram参与度的强大视图,用于发布,链接,公共页面,团体中的视频以及经过验证的用户。重要的是,它不提供有关向用户显示内容的次数的数据。
Facebook公开批评使用CrowdTangle了解在Facebook上被放大的新闻的记者。 Facebook说,为了衡量人气,您需要衡量看到该帖子的人数。但是,目前,Facebook尚未公开提供印象数据。
Citizen Browser试图通过组装不同人口的Facebook用户面板并监视向他们推荐哪些内容来检查这些算法。
蓝色提要,红色提要是《华尔街日报》记者乔恩·基根(Jon Keegan)的2016年项目(乔恩·基根现在是The Markup的研究者,也是该方法的贡献者),该研究使用Facebook自身的数据检查了1000万美国用户在六个过程中的共享习惯个月。根据自我描述的政治信仰和用户的共享习惯,《华尔街日报》使用了与最偏党派用户最密切相关的新闻来源,并排展示了自由和保守新闻源的外观模拟视图。
纽约大学广告天文台是一个支持浏览器扩展的项目,可存档和共享来自Facebook和Google的政治广告库的广告和元数据以及针对已下载扩展并在其桌面上登录Facebook的志愿者的定向广告。为了遏制第三方数据收集,在2020年美国总统大选前夕,Facebook向纽约大学致信,要求终止该项目。
尼曼实验室(Nieman Lab)使用亚马逊的Mechanical Turk平台对173个人进行了调查,以了解他们在新闻Feed中看到的新闻来源。令人惊讶的是,对于2020年10月令人难以置信的繁忙新闻周期,它发现大多数抽样用户根本看不到新闻(在其供稿的前10个帖子中)。
对于讨论婴儿潮一代在阴谋论和Facebook上误传的观点,《纽约时报》的查理·沃泽尔(Charlie Warzel)做了一个类似的实验,观察了两个同意共享其证件的陌生人的Facebook提要。
Citizen Browser监视Facebook在其新闻源中向用户呈现的内容以及向他们建议的组和页面。
该小组目前由来自美国48个州的参与者组成。我们使用了一个调查研究提供者,邀请具有国家代表性的美国成年人抽样作为付费参与者加入该项目。因为我们只能接受使用台式机或笔记本电脑,安装了Chrome网络浏览器并且是Facebook的活跃用户的参与者,所以很难吸引参与者。我们接触的大约95%的参与者未能完成注册要求。小组成员的人数也有所波动:由于小组成员出于各种原因退学,我们招募了新的参与者。
为了最准确地描述该动态专家组在发布之时的人口构成,我们根据专门小组成员制表了小组成员的人口组成,这些专家在2020年11月30日至12月30日之间保持应用程序之间的联系在此期间捕获了20个数据。
下表描述了该小组在12月时间范围内的人口统计数据,以及根据美国人口普查局2016年美国社区调查得出的全国平均水平得出的目标人口统计数据。
尽管我们尽了最大的努力,但我们仍未达到针对西班牙裔和拉丁美洲裔专家的目标,这也是其他民意测验人员也面临的挑战。我们还没有达到特朗普选民的目标,民意测验在总统大选前同样面临这种现象。我们的小组比美国人口年龄大,受教育程度高,这反映了台式计算机的使用情况。
Citizen Browser应用程序是基于开源Electron JavaScript框架的独立桌面应用程序。该应用程序与Windows和macOS操作系统兼容。小组成员在进行了简短的人口统计调查后,便通过小组管理门户网站下载了该应用程序。当他们下载该应用程序时,要求小组成员在该应用程序控制的浏览器中登录Facebook。成功登录后,不再需要小组成员与应用程序进行交互。
该应用程序设计为可全天候运行24/7,并在用户计算机的后台保持打开状态,并在“开始”栏或“查找器”工具栏中将其最小化。该应用程序每天使用Netgraph开发的专有浏览器自动化工具NGFetch执行Facebook捕获一到三次。 NGFetch使用Chrome Devtools协议和JavaScript的组合来加载网页并与之交互。如Netograph所描述的,NGFetch从浏览器捕获数据,包括HTML,页面的屏幕快照以及除大型响应正文(HTML / images / CSS)之外的所有元数据。
为了捕获数据,该应用程序使用登录的浏览器配置文件访问以下Facebook网址: