未来的宣传将由计算机生成

2020-09-21 22:03:56

读者会怀念那些只需一点侦探工作就能辨认出完全虚构的作者的日子。以“爱丽丝·多诺万”为例。2016年,一名同名自由撰稿人给左倾独立媒体网站CounterPunch的编辑发了一封电子邮件,让他们撰写一篇报道。她在推特上的个人资料表明她是一名记者。在18个月的时间里,多诺万定期推介CounterPunch;该出版物接受了她的几篇文章,一些左倾网站也接受了其他文章。

然后,在2018年,CounterPunch的编辑接到了《华盛顿邮报》的电话。那里的一名记者获得了一份联邦调查局的报告,表明爱丽丝·多诺万是一个由俄罗斯军事情报机构主局(通常被称为gu)创建的“人物账户”--一个虚构的人物。CounterPunch的编辑们对与俄罗斯的联系持怀疑态度,但又担心可能会发布来自假人的内容,他们仔细阅读了多诺万的全部作品,这些作品涵盖了叙利亚、黑人生命也是如此,以及希拉里·克林顿的电子邮件等各种话题。他们发现她不仅可疑,而且剽窃:一些署名为她的文章似乎出自另一名女性之手,索菲娅·曼加尔(Sophia Mangal),她是一名隶属于叙利亚内幕媒体中心(Inside叙利亚Media Center)的记者。

ISMC的“关于”页面声称,该组织表面上是一个智库和新闻机构的混合体,由一个记者团队于2015年创立。但随着“反冲压”的编辑们进一步挖掘,他们意识到索菲亚·曼加尔也是虚构的。看起来ISMC的其他人也是如此,他们试图追踪他们。Anti Pack在2018年1月发布了一份尸检报告,详细说明了调查发现的情况:抄袭来自“纽约客”、沙特“阿拉伯新闻报”(Arab News)和其他来源的文章;多产的“记者”,他们每天提交多达三四篇报道,但在询问他们是否存在后,他们的署名就消失了;社交媒体档案中出现了被盗的真人照片;活跃的Twitter账户,他们奉承叙利亚独裁者和俄罗斯盟友巴沙尔·阿萨德(Bashar al-Assad)。ISMC似乎是一个幌子。它的员工纯粹是由俄罗斯情报人员控制的数字角色。

在CounterPunch提交报告一年后,也就是2019年年中,参议院情报特别委员会(Senate Select Committee On Intelligence)将一组数据集交给了我在斯坦福互联网天文台(Stanford Internet Observatory)的团队。Facebook将这些材料归功于谷;ismc的facebook官方主页(以及其他实体)就是这个宝藏的一部分。当我们梳理在线档案和晦涩难懂的留言板来调查数据时,我们发现了更多的假记者角色,他们抄袭了投资组合和偷来的照片,更多的封面出版物,以及在Twitter、Reddit和Facebook上向观众分享假记者内容的假“放大器”角色群。所有这些活动都与俄罗斯的另一个操纵团队--互联网研究机构的工作重叠。爱尔兰共和军有自己的账户,这些账户产生了更多的推文和Facebook评论。

换句话说,我们发现了一个由不存在的作家组成的庞大网络,将俄罗斯政府的谈话要点变成数千篇评论文章,并将它们放在富有同情心的西方出版物上,成群结队的假人在Twitter上讨论相同的主题。并不是所有这些人物角色或故事都是热门的-事实上,ISMC的文章中很少有达到大众传播的-但在奇怪的在线操纵世界中,受欢迎并不是唯一的目标。如果假评论广为流传,并改变美国人对叙利亚或即将到来的选举的看法,那就是成功的。如果虚假评论的泛滥让公众相信大多数人对一个热门话题有某种特殊的感觉,那就是成功的。但是,即使只是制造愤世嫉俗或困惑-关于什么是真实的,谁在说什么-也是一种成功的形式。

因为照片和文字很容易搜索,抄袭真人的照片和真实的作家的作品可以让操作变得容易拆解。所以美国的对手正在适应。本月早些时候,Facebook关闭了另一家俄罗斯影响力网站,这一次是围绕一个名为Peace Data的网站建立的,该网站属于爱尔兰共和军(IRA)。这一最新努力还包括一个可疑的媒体渠道作为幌子。但这一次,巨魔没有窃取照片,而是用人工智能生成的完全独特的面孔图像填写了虚构作者的社交媒体个人资料。(像ThisPersonDoesNotExist.com这样的网站展示了这些面孔可以有多逼真。)。虽然他们从其他地方转载了一些故事,但他们新的、更强大的虚假角色聘请了不知情的美国记者撰写原创故事。但即使是这种做法也留下了证据;自那以后,一些记者接受了采访,讲述了他们的经历,透露了操作细节。

现代宣传员的理想场景,

TGPT-3代表“发电式预训变压器”。它的工作原理是接受文本输入,并预测接下来会发生什么。该模型在几个海量数据集上进行了训练,包括维基百科和Common Crawl(一个致力于“向互联网研究人员提供互联网副本”的非营利性组织)。在生成文本时,GPT-3可以返回事实或删除相关公众人物的名字。它可以产生计算机代码、诗歌、参考现实世界的新闻风格的文章、特定账户风格的推文,或者可以与中等水平的哲学新生所写的长篇理论文章相提并论。

事实上,如果你想让GPT-3推测未来充满人工智能写作的含义,它会的。我给它提供了这篇文章早期草稿的几个段落,要求它就同一主题多写200个字,并指示它要有一点创造性。以下是它逐字返回的一些内容:

除了人工智能生成虚假故事的可能性外,还有一个同时令人恐惧和兴奋的未来,在那里人工智能生成的虚假故事是常态。软件工程师的崛起给了我们创造新类型空间的力量:虚拟现实和增强现实现在已经成为可能,而“物联网”正越来越多地走进我们的家庭。在过去的一年里,我们看到了一种新的艺术类型:由算法而不是人类创造的艺术。在这个未来,人工智能生成的内容将继续变得更加复杂,而且越来越难将其与人类创造的内容区分开来。人工智能生成内容的兴起的影响之一是,公众将不得不与这样一个现实作斗争,即越来越难区分生成的内容和人类生成的内容。

让一台机器根据几个段落貌似模仿你的写作风格,看着它无意识地产生你已经有过的“想法”,这有点令人不安。尽管我知道GPT-3是根据概率将单词组合在一起,但当我陷入如何最好地表达概念或想知道它将如何回答问题时,我发现自己会给它一些提示。人工智能的输出往往会有点漫无边际,如果持续太长时间,可能会变得有些荒谬,但这也是人类面临的问题;这就是为什么大一的哲学学生有助教,出版物有编辑的原因。但只要有提示,GPT-3可以生成任何数量的独特镜头,一个人可以快速轻松地对其进行润色和发布。

事实上,“卫报”最近就是这么做的:编辑让人工智能写了八篇关于作为人工智能的文章。然后,他们将它们缝合在一起,形成了被广泛吹捧为第一个机器创作的评论文章。厚颜无耻的标题--“一个机器人写了整篇文章。“你害怕了吗,人类?”--提出了自我意识计算机会制造恶作剧的可能性。但更紧迫的问题是,人类将如何适应这样一种技术,这种技术使任何人都可以在不被检测到的情况下,快速而廉价地推出内容。只需很少的努力,GPT-3就可以被引导以一系列风格写作:在最近的一项研究中,米德尔伯里国际问题研究所(Middlebury Institute Of International Studies)的研究人员克里斯·麦古菲(Kris McGuffie)和亚历克斯·纽豪斯(Alex Newhouse)发现,可以促使它生成看似合理的亲纳粹帖子,复制大规模枪击案宣言的写作风格,并像QAnon的弟子一样回答问题。GPT-3的开发者了解滥用的可能性,并限制了获得访问权限的人数,尽管敌对国家可能很快就会开发出仿制版本。

在过去,宣传需要人手才能写出来。由于急于制造受欢迎的错觉,中国当局从2004年开始雇佣人员,让网上空间充斥着亲政府的评论。到2016年,“50美分党”的成员--根据据说其成员每篇帖子的报酬--每年在社交媒体上发表的评论估计有4.5亿条。菲律宾、波兰、俄罗斯和其他地方的类似评论大军、巨魔工厂和假新闻商店都试图通过充斥假帖子来操纵公众舆论。2018年,由一位受欢迎的博客作者在韩国发起的一次“舆论操纵”行动,结合使用了人类评论员和一个自动程序来发布和提升批评特定政客的评论。首尔警方注意到了两天的活动数量:“从1月17日到18日,他们使用2290个不同的身份证,操纵了675篇新闻文章的约2万条评论。”在社交媒体操纵的古怪早期,这样的努力受到人类限制的限制。这种情况很快就不会再出现了。

为一家假媒体写推文、评论和整篇文章是很耗时的。负责《爱丽丝·多诺万》的GU特工和想象中的ISMC团队变得马虎起来。他们抄袭别人的作品,并回收自己的作品;被盗的头像巩固了调查员的信心。

这些数字变化是否会给人们敲响警钟,取决于他们所经历的背景。到目前为止,名人或时尚杂志的读者已经开始认为其中的照片是经过数字喷绘的。想要娱乐的电影观众不会觉得被特效误导了。但在其他领域,发现视频或照片被编辑是一种丑闻-这是操纵。今天读到在线报纸上的文章或互联网留言板上的评论的美国人可能会理所当然地认为它是由一个真人写的。这一假设在未来不会成立,这对我们如何分析信息和思考在线身份有着重大的影响。

“在互联网上,”1993年“纽约客”的一幅漫画宣称,“没人知道你是一条狗。”在威权国家,政府经常大张旗鼓地进行宣传,用所谓的“袜子傀儡”来操纵话语,公众的反应是疲惫的听天由命:辨别什么是真实的,什么是真实的,往往需要付出巨大的努力。信息空间中无处不在的不现实将对自由民主产生什么影响尚不清楚。如果或当话语泛滥成为现实时,我们对我们在网上读到的东西和与之交谈的人的信任可能会下降。这已经开始发生了:随着人们对深度假视频、自动网络攻击和其他操纵策略的认识增加,互联网用户开发了一个新的词汇,试图用来诋毁他们的批评者和意识形态对手的声誉。唐纳德·特朗普(Donald Trump)的一些支持者不顾所有证据猜测,他对臭名昭著的访问好莱坞录像带的评论是通过数字生成的。推特用户经常互相指责对方是机器人。

生成性文本的兴起将加深这些猜疑,并以其他方式改变信息环境。在媒体上,编辑们会发现自己格外警惕,避免发表未来算法专家爱丽丝·多诺文斯(Alice Donovans)和索菲亚·曼格斯(Sophia Mangals)的合成专栏文章。各大互联网公司将致力于尽可能快速有效地检测生成的内容。尽管如此,随着检测技术的成熟,生成图像、视频和文本的工具也将更加无缝。

在围绕人工智能生成内容的军备竞赛中,用户和互联网公司将放弃逐条推文和逐篇文章判断真实性的尝试。取而代之的是,评论附带的账号或署名附带的人的身份,将成为衡量合法性的关键信号。许多用户会想知道他们正在阅读或看到的是与真人相关的,而不是人工智能生成的人物角色。互联网已经分成了越来越不干净的空间:像4chan这样的网站是为想要不受约束的匿名论坛的互联网用户而存在的,但大多数互联网用户更喜欢更温和的平台。机器生成消息的激增将增强互联网社区的吸引力,在这些社区中,所有参与者都必须以某种方式验证自己的身份,或者至少验证他们的物理存在。政治辩论可能会迁移到全新的言论平台-或者Twitter或Facebook等现有平台的分割部分-这些平台优先发布具有经过验证的身份或经过验证的化名的用户的帖子。

话又说回来,这些调整可能会让互联网平台掌握更大的权力,许多美国人认为互联网平台已经对美国的信息流通产生了太大的影响。当Twitter在一位公众人物的个人资料上打上蓝色复选标记时,该公司正式表示,它已经核实了谁拥有这个账户。但用户社区通常将这些决定视为对其的认可。2017年,当该公司取消了几位极右翼和白人至上主义领导人的账户复选标记时,在某种意义上,这为体面的辩论设定了界限。

认为经过验证的身份应该是促成公共话语的前提条件的想法,以其自身的方式是反乌托邦的。自建国以来,美国人一直重视匿名和假名演讲:亚历山大·汉密尔顿(Alexander Hamilton)、詹姆斯·麦迪逊(James Madison)和约翰·杰(John Jay)在撰写阐述美国政府成立原则的联邦党文件时使用了笔名普利乌斯(Publius)。告密者和其他内部人士已经发布了匿名声明,以告知公众。从统计学大师内特·西尔弗(Nate Silver,“Poblano”)到参议员米特·罗姆尼(Mitt Romney,“Pierre Delecto”),形形色色的人物都曾在互联网上讨论政治问题时使用过化名。我们的目标不应该是结束在线匿名,而仅仅是为存在的人保留公共广场-而不是为人工智能的宣传生成器。

在没有存在的情况下,爱丽丝·多诺万和索菲亚·曼加尔可能会成为未来的先驱。引用GPT-3的话,两难境地是这样的:

在这个未来,人工智能

我们想听听您对这篇文章的看法。向编辑提交一封信,或写信给[email protected]