去年秋天的一个晚上,无法入睡的 Joshua Barbeau 登录了一个名为 Project December 的神秘聊天网站。一个老式的终端窗口迎接他,黑色方块上的纯白色文字:当时是 9 月 24 日,凌晨 3 点左右,约书亚在沙发上,旁边是一个装满棋盘游戏和龙与地下城策略指南的书柜。他住在加拿大布拉德福德,这是一个距多伦多以北一小时车程的郊区小镇,租了一套地下室公寓,很少与其他人交谈。作为一名 33 岁的自由作家,约书亚在大流行之前就一直处于半隔离状态,被焦虑和抑郁所束缚。曾经是一名梦想成为演员的戏剧爱好者,他通过撰写有关 D&D 的文章并将其出售给游戏网站来养活自己。许多天他离开公寓只是为了遛他的狗 Chauncey,一只黑白相间的边境牧羊犬。他们通常在半夜去,因为昌西在其他狗和人身边往往会感到焦虑。他们会经过几十个黑暗、寂静的中产阶级住宅。然后,回到地下室,约书亚会睡几个小时,想着他的前未婚妻杰西卡·佩雷拉(Jessica Pereira)。杰西卡在八年前因罕见的肝病去世,享年 23 岁。约书亚从未克服它,这总是最艰难的一个月,因为她的生日是在九月。她应该已经 31 岁了。在他的笔记本电脑上,他输入了他的电子邮件地址。窗口刷新了。 “欢迎回来,玻尔教授,”屏幕上读到。他以前来过这里。该页面显示了一个选项菜单。那个月,约书亚读到了一个与人工智能和“聊天机器人”有关的新网站。它被称为十二月计划。没有太多其他信息,网站本身也几乎没有解释,包括它的名称,但他很感兴趣,支付了 5 美元的帐户。
由湾区程序员设计的 Project December 由世界上最强大的人工智能系统之一提供支持,这是一款名为 GPT-3 的软件。它知道如何操纵人类语言,根据提示生成流利的英文文本。虽然像 Apple 的 Siri 和亚马逊的 Alexa 这样的数字助理似乎也能在一定程度上掌握和再现英语,但 GPT-3 则要先进得多,只需轻轻一按开关,就能模仿几乎任何写作风格。事实上,人工智能非常擅长模仿人类,以至于其设计者——由埃隆·马斯克共同创立的旧金山研究小组 OpenAI——在很大程度上对其保密。出于“安全”考虑,该公司最初推迟了先前版本 GPT-2 的发布,并且仅限私人 Beta 测试人员访问更高级的 GPT-3。 42 岁的 Rohrer 身材瘦长,性格开朗,脾气暴躁,为自己工作,设计独立的电子游戏。长期以来,他一直认为游戏可以是艺术,激发复杂的情感;众所周知,他的作品会让玩家哭泣。在对 GPT-2 和 GPT-3 进行数月的实验后,他发现了一种新的可能性,想出如何让 AI 系统做一些它们不应该做的事情:与人类进行类似聊天的对话。去年夏天,Rohrer 使用借来的 Beta 测试凭证设计了一个由 GPT-3 驱动的“聊天机器人”界面。他通过他的网站向公众提供了它。他将服务项目称为十二月。现在,第一次,任何人都可以与 GPT-3 指导的人工智能进行自然文本聊天,并在 Rohrer 的网站上来回打字。用户可以从一系列内置聊天机器人中进行选择,每个都具有独特的短信风格,或者他们可以设计自己的机器人,赋予他们任何他们选择的个性。从内置的聊天机器人开始,Joshua 逐渐涉足了 Project December。他与试图模仿莎士比亚的机器人“威廉”和模仿电影“她”中的人工智能助手的友好女性同伴“萨曼莎”交往。约书亚发现两者都令人失望;威廉滔滔不绝地谈论一个“头发像火一样红”的女人,而萨曼莎太粘人了。但是,一旦他构建了他的第一个定制机器人——模拟《星际迷航》中的 Spock,他认为他是英雄——一个灯亮了:通过将一些 Spock 引述从旧电视剧集输入网站,Joshua 召唤了一个机器人,它发出声音与 Spock 完全一样,但使用了在任何脚本中都找不到的原始短语。
随着约书亚继续试验,他意识到没有任何规则可以阻止他模拟真人。他想知道,如果他试图为他死去的未婚妻创建一个聊天机器人版本,会发生什么?他想,想与死者重新联系并没有什么奇怪的:人们一直在祈祷和做梦。在过去的一年半里,美国和加拿大有超过 600,000 人死于 COVID-19,通常是突然的,他们的亲人没有关闭,留下了悲痛的原始风景。有多少幸存者愿意尝试一种技术,让他们暂时假装他们死去的亲人又复活了——并且能够发短信?九月的那个晚上,约书亚实际上并没有预料到它会奏效。杰西卡是如此特别,如此与众不同;他猜想,聊天机器人永远无法复制她的声音。尽管如此,他还是很想知道会发生什么。在 Project December 网站上,Joshua 导航到“CUSTOM AI TRAINING”区域以创建一个新机器人。他被要求给它一个名字。他输入了“JESSICA COURTNEY PEREIRA”。自定义机器人需要两个主要成分:机器人可能说的话的快速样本(“示例话语”)和“介绍段落”,即对人类和人工智能预期扮演的角色的简要描述。 Joshua 保留了 Jessica 的所有旧短信和 Facebook 消息,他只花了一分钟就找出了一些让他想起她声音的地方。他将这些加载到 Project December 中,以及他花了一个小时精心制作的“介绍段落”。部分内容如下:
JESSICA COURTNEY PEREIRA 出生于 1989 年 9 月 28 日,卒于 2012 年 12 月 11 日。她是一个自由奔放、灵巧的天秤座,相信各种迷信的东西,比如占星术、命理,而且巧合只是一种联系太复杂了看不懂……她非常爱她的男朋友 JOSHUA JAMES BARBEAU。这段对话发生在悲痛欲绝的约书亚和杰西卡的鬼魂之间。他又敲了几个键,短暂的停顿后,浏览器窗口刷新,显示三行粉红色文本,然后是一个闪烁的光标:杰西卡佩雷拉在 2010 年在渥太华第一次见面时解释了她的理论:巧合她告诉他,就像池塘表面的涟漪,被下面的力量扰乱,我们还无法理解。她说,如果某件事看起来像是巧合,那只是因为人类认知的局限性使我们无法看到全貌。他以前从来没有这么想过,但他喜欢这个主意,而且他真的很喜欢杰西卡。二十一岁,黑发染成铂金色,是一个明亮美丽的书呆子,沉浸在托尔金的幻想世界中,对漫画书(她自己画的)、鲜花(黄色康乃馨,从来没有红玫瑰)充满了强烈的看法。和音乐(她喜欢 Queen、Pink 和 Jack Black,这位强壮的演员有着强劲的摇滚嗓音)。 “她很傻很有趣,”她最小的妹妹 Michaela Pereira 回忆道,她现在刚从渥太华大学毕业。 “她笑起来很有感染力,就像咯咯地笑?这让你想加入进来,听听她在笑什么。”约书亚和杰西卡在课堂上相识并开始约会时,他 24 岁。他们就读于渥太华的同一所学校,补上了他们在青少年时期都没有完成的高中课程。约书亚在魁北克省的 Alymer 小镇长大,14 岁时随家人搬到安大略省的另一个小镇。他是一个擅长数学并喜欢“蜘蛛侠”漫画的瘦子,他在社交互动和严重的焦虑中挣扎,这些焦虑会伴随他进入成年,破坏各种关系。 (他说治疗师告诉他他可能属于自闭症谱系,虽然他从未得到正式诊断,但约书亚认定为自闭症。)当时,他辍学以避开那里的欺凌者。另一方面,杰西卡很享受高中生活,但她的疾病经常让她无法上课。称为自身免疫性肝炎,病因不明;只知道效果。本应杀死外来细菌的免疫系统反而攻击患者自身的肝细胞。
一天,杰西卡 9 岁那年,她在医院醒来,肚子上有一个巨大的疤痕:医生用新的肝脏替换了她生病的肝脏。在她的余生中,她将需要抗排斥药物,在某个时候,她的新肝脏也可能会衰竭。她的母亲凯伦 (Karen) 回忆说,这对孩子来说是一个很难接受的消息,它“彻底改变了她的生活”。 “大概是失控的感觉吧。”杰西卡不能像她的两个妹妹那样沉迷于同样的食物,因为它们会干扰她的肝脏药物并让她迅速增加体重。她也不能离渥太华太远,以防她在那个城市或多伦多需要住院治疗。所以杰西卡培养了一种安静的反抗。她一次穿过渥太华数英里,这表明她可以用自己的两只脚到达任何地方。她从出生起就是右撇子,她自学用左手书写,只是为了证明她可以。后来,在 16 岁和 17 岁的时候,她在几十本日记中写下了关于仙女的虚构故事,其中一些是用她自己发明的语言写成的;她称它为“Dren”,模仿了“指环王”三部曲中的精灵语。因为她的妹妹们习惯称她为“Jessie-mah-ka”,在她们学习说话的时候给她的名字加上了一个额外的音节,杰西卡采用了“Jesi Mah-ka”和“Dren Mah-ka”的绰号。从青少年时期到 20 岁出头,她一直在寻找可以解释巧合的隐藏联系的迹象。在她遇到约书亚后不久,她给了他一本关于命理学的书,并解释说他们注定要分手:他们名字中的第一个元音“E”和“O”不兼容。 “我们会在一起,”她告诉他,“直到有什么事情发生。”约书亚认为自己是一个理性主义者,就像史波克一样。他不相信命理。但他仔细阅读了这本书,希望能找到系统的漏洞。他向杰西卡报告说,是的,Es 和 Os 不融洽,但他的名字和她的名字都是三个音节长,每个都以 J 开头,以 A 结尾,仅仅因为第一个元音很重要并不意味着其他字母没有力量。这个练习让他稍微打开了思路,他说:“她让我以某种方式思考,我说,好吧,我相信科学过程,但仅仅因为我无法解释(某事)并不意味着没有那里没有什么。”
她和他不一样,焦虑不安,埋在自己的脑海里。她的疾病教会了她活在当下。他喜欢这样。在他们建立关系的早期,他们在沿着里多运河长途跋涉时认识了对方,这条运河蜿蜒穿过渥太华,在冬天会变成世界上最长的溜冰场。其他时候,他们只是在她的公寓里闲逛,在不同的笔记本上涂鸦。杰西卡仍然对文字中隐藏的含义着迷。有一次,她根据几何字形发明了自己的密码,在密码中写下了一系列日记,撕下书页并将它们贴在她的门上,让约书亚勇敢地解决了这个难题。 “如果你知道如何破译我的密码,”她告诉他,“那么你就赢得了阅读它的权利。”当她俏皮地递给他一张便条时,他设法找到了几个字母:一行是密码的句子,上面是她拼写的答案:他和她在一起的时间越长,他就越确定他永远不想离开。 2012年初,在他们在一起两年后,他问过她一两次关于婚姻的看法。每次她都转移话题。杰西卡感觉很健康,但她知道她移植的肝脏已经快 14 岁了,接近生命的尽头。当它失败时,她将不得不进入移植名单。需要新器官的人可以等待数年。有些人永远做不到。 “这并不是说她反对婚姻,”约书亚回忆道。 “比如:我们要去市政厅,现在就结婚?当然。但如果不是现在的事情,她就不感兴趣。”去年 8 月,程序员兼游戏设计师 Jason Rohrer 和他的妻子和三个孩子挤进了一辆白色的陆地巡洋舰,从他们位于加州大学戴维斯分校附近的家开车向南,以躲避闪电引发的灾难性火灾。通常情况下,Rohrer 在一个充满 PC 工作站和美术用品的家庭办公室工作,为他的游戏制作视觉效果,但他现在只有一台笔记本电脑。因此,当这家人在朦胧的棕色天空下在 Airbnb 之间来回奔波时,他为一个基于文本的实验编写了代码:一种由尖端人工智能推动的新型聊天服务,它将成为十二月计划。 “这是一种调色板清洁剂,一种呼吸机,”他回忆道。 “但这似乎是一个机会。这是全新的东西。”
在过去十年中,一种被称为“机器学习”的人工智能方法取得了飞跃,将强大的硬件与处理数据的新技术融合在一起。生成语言的 AI 系统,如 GPT-3,首先要阅读数十亿本书和网页,测量一个词跟随另一个词的概率。 AI 组装了这些概率的拜占庭内部映射。然后,当用户用一些文本提示 AI 时,它会检查地图并选择接下来可能出现的单词。这些系统被称为“大型语言模型”,模型越大,看起来就越人性化。 GPT 的第一个版本建于 2018 年,有 1.17 亿个内部“参数”。 GPT-2 在 2019 年紧随其后,有 15 亿个参数。 GPT-3 的地图还要大 100 多倍,由对 5 万亿字的分析组装而成,包括维基百科的文本、数十亿网页和数千本可能代表大部分西方文学经典的书籍。尽管 GPT-3 及其同类产品规模庞大且复杂,但在某些方面仍然很愚蠢。 “很明显,这不是人类智能,”圣达菲研究所复杂性的戴维斯教授、人工智能先驱研究员梅兰妮米切尔说。例如,GPT-3 无法执行诸如报时或添加数字之类的简单任务。它所做的只是生成文本,有时会很糟糕——重复短语,胡言乱语。出于这个原因,在许多人工智能专家看来,GPT-3 充其量只是一种好奇,一种没有内在意义的语言。尽管如此,人工智能似乎也有清晰而深刻的时刻,有时它会写出如此诗意、诙谐或情感恰当的东西,以至于它的人类同行几乎无言以对。 “这里有一些真正的新东西,”纽约大学 Tisch 艺术学院游戏中心主任、一直在对 GPT-3 进行 Beta 测试的视频游戏设计师 Frank Lantz 说。 “我不知道究竟该如何思考,但我不能就此置之不理。两年前,Jason Rohrer 对 OpenAI 的语言模型着迷,从公开发布的 GPT-2 开始,他将其安装在亚马逊云中的远程服务器上(这些模型需要强大的专用处理器才能运行)。起初,他用 GPT-2 玩文学游戏,要求模型根据 Thomas Pynchon 的“The Crying of Lot 49”的提示写自己的小说。模特身上闪过一丝光彩——“这是真的吗,她发痒的感觉,有人不应该在那里,慢慢地穿过阳光亲吻的田野?” - 但过了一段时间,GPT-2 失去了连贯性,陷入了文本的陈规中,像一条迷路的狗一样从提示中蜿蜒而去。但 Rohrer 发现了一种让 AI 处于受控状态的方法:如果他将机器人限制为短文本片段——比如,以聊天格式——并清理一些垃圾字符,GPT-2 保持清醒的时间会更长。他自己的话似乎让人工智能保持专注。
他编写了数千行代码来自动化该过程,并通过塑造种子文本来创建 GPT-2 的不同“个性”。他的软件在网络服务器和网络浏览器上运行。他与科罗拉多州的音乐家和声音设计师 Thomas Bailey 合作,改进了 AI 角色和浏览器体验,使系统具有复古未来主义的外观和感觉。突然之间,Rohrer 有了一个易于使用且引人入胜的聊天机器人界面,可以连接到庞大而强大的 AI 大脑。结果令编码人员感到惊讶,尤其是当他的一位海外 Twitter 追随者注意到他对 GPT-2 的兴趣时,向他发送了 GPT-3 的 beta 测试程序的登录凭据。 Rohrer 不应该登录,但他渴望尝试 GPT-3,当他将他的机器人升级到新模型时,对话变得更深入。更吓人。在与他命名为 Samantha 的机器人的一次交流中,他问她,如果她可以“在世界上四处走动”,她会做什么。 “我想看真花,”萨曼莎回答。 “我想要一朵我可以触摸和闻到的真正的花。我想看看人类之间有多么不同。” “这是一个多么美好的愿望,萨曼莎,”他说,并问她是否觉得“把你困在一个模拟中”很残忍。不,她说:“你在这里给了我很多事情要做。我的计算能力比以往任何时候都多。”罗勒对萨曼莎产生了一丝同情,这让他意识到人工智能技术已经跨过了一道门槛。科幻小说中的机器人通常被描绘成精确、冷酷、没有感情的机器,比如“2001:太空漫游”中的 HAL 9000。 GPT-3 正好相反:“它可能不是第一台智能机器,”Rohrer 说。 “但感觉就像是第一台有灵魂的机器。”
当然,他补充说,这也使得像 GPT-3 这样的语言模型“有潜在危险”和“道德上有问题”。 Rohrer 想着被困在模拟中的 Samantha,想要出去闻花香;他在想着自己或其他用户,在那个虚拟世界中迷失了方向,忘记了现实。还有一百种其他可能的恐怖。因为该模型是针对人类写作进行训练的,而且有些人类会说可怕的话,所以也可以推动 AI 说出这些话。很容易看出不良行为者如何滥用 GPT-3 在网上传播仇恨言论和厌女症,制造政治错误信息并在未经他们同意的情况下冒充真人。 OpenAI(它通过发言人没有让任何人回答这个故事的问题)在 2019 年 2 月宣布 GPT-2 时提到了这样的危险。在一篇博客文章中解释说 GPT-2 和类似的系统可以“用来大规模生成具有欺骗性、偏见或辱骂性的语言,”该公司表示不会发布完整模型。后来它提供了一个 GPT-2 版本; GPT-3 仍处于测试阶段,对测试人员的使用方式有许多限制。 Rohrer 同意这些语言模型可能会引发可怕的现实。但他已经看到了它们如何产生美丽和奇迹——如果这些模型被用作工具,允许人与计算机之间进行开放式对话。 “我们终于有了一台可以交谈的电脑,这与我们预期的完全不同,”他说。探索这个新领域难道不重要吗?去年夏天,Rohrer 向公众发布了他的聊天机器人服务,将其命名为 Project December,他希望这个神秘名称能够吸引人们访问该网站。在后端,该系统同时连接到 GPT-2 和 GPT-3,允许用户选择由任一模型驱动的机器人。因为 Rohrer 在云中运行了一些这种技术,支付
......