Cory Doctorow:过去的表现并不预示未来的结果(2020 年)

2021-08-01 00:41:54

我在 2020 年 7 月的专栏“充分就业”中写道,“我是一个人工智能怀疑论者。我对任何不是的人感到困惑。我没有看到任何从持续改进到(公认令人印象深刻的)“机器学习”领域导致通用 AI 的路径,就像我看到的从马匹育种的持续改进导致内燃机的路径一样。 ”今天,我想扩展一下。让我们来谈谈机器学习是什么:它是一种统计推理工具。这意味着它分析训练数据以发现不同现象之间的相关性。您的手机会观察到,每次您输入“嘿”时,您通常会跟在它后面跟着“亲爱的”,并且它会在您下次输入“嘿”时自动提示。这不是巫术,而是“魔法”——从某种意义上说,这是一种客厅把戏,在你学习了基本方法之前,这似乎令人费解,然后就变得平庸了。自动检测统计相关性很有用!两只眼睛、一个鼻子和一张嘴与一张脸相关联,具有非常高(尽管不完美)的可靠性。对于预测汽车或猫、直升机或 AR-15 的特征也是如此。某些可见特征是皮肤癌的良好预测指标,某些波形可靠地对应于书面文字。机器学习为我们留下了丰富的自动化工具,这些工具具有高度的可靠性,可以对从现实世界中获取的数据进行分类和处理。但这还不是全部。机器学习是无理论的:它不知道嘴巴、眼睛和鼻子——它知道它已经标记了训练数据,这些数据将某些几何形状识别为人脸的代表。这就是为什么我们会听到关于门铃摄像头在融化的雪中产生幻觉的有趣故事,并寻呼它们的主人警告他们潜伏的陌生人。任何曾经注视过云的人都知道,在我们的现实世界中有很多类似面孔的元素,并且没有任何“面孔”的统计图片可以完美替代理解面孔的真正含义。无理论统计推断的问题远不止在雪地里产生幻觉。任何上过基础统计课程的人都知道“相关性不是因果关系”。例如,也许警察在黑人社区发现更多犯罪的原因可能是因为他们更多地以借口拦截和搜查骚扰黑人,为他们提供不公平指控的基础,这一过程导致许多不公正的认罪,因为该系统被操纵到铁路人们认罪而不是对抗指控。理解这种关系需要“详细描述”——人类学家的术语,用于密切关注数据集主题的定性体验。克利福德·格尔茨 (Clifford Geertz) 的同名经典文章谈到了他目睹其中一个对象对另一个对象眨眼的经历,但他无法确定是调情、攻击、抽搐还是眼中的灰尘。找出答案的唯一方法是去和两个人交谈,发现体验中定性的、内部的、不可计算的部分。定量学科因无法进行数学分析而将定性元素焚毁而臭名昭著。留下的是可疑价值的定量残留物……但至少你可以用它做数学题。这在统计上相当于在路灯下寻找钥匙,因为你丢钥匙的地方太暗了。

这不是解决问题的好方法。 8 月,一群物理学家在密歇根州阿尔比恩学院设计了一个模型来预测新型冠状病毒的传播,成为头条新闻。物理学家发表了一系列不明智的评论:a) 流行病学与物理学相比有多么容易; b) 他们的模型在抑制疾病传播、将病例总数限制在不超过 100 方面的效果如何,这是最坏的情况。自然而然,病例数在几天内飙升至 700 多起,校园不得不关闭。该模型完美地考虑了所有定量因素,并丢弃了定性因素,例如学生可能会喝醉并参加舔眼球派对的可能性。机器学习对系统的定量元素进行操作,并量化或丢弃任何定性元素。而且因为它是无理论的——也就是说,因为它不了解它所识别的相关性之间的因果关系——它无法知道什么时候犯了错误。在这一点上,这种赤字在放大偏见方面所起的作用已经得到了很好的理论解释和广泛宣传:将以前成功候选人的简历提供给招聘算法,你最终会招聘到与你一直雇用的人一模一样的人;用信用评估系统做同样的事情,你会冻结那些历史上面临财务歧视的人;尝试进行保释风险评估,你将把你在审判前一直关押在监狱里的那些人关起来。唯一的区别是它发生得更快,并且带有经验洗脸的外表,为那些从歧视中受益的人提供了合理的否认。但这里还有一个重要的观点——与我在 2020 年 7 月的“充分就业”中提出的观点相同:统计推断中没有持续、渐进的改进路径,可以产生我们在说“时所想到的那种理解和综合”。人工智能。”能够以 75% 的概率计算输入 a、b、c...z 加起来结果 X 仍然不会告诉你逮捕数据是否是种族主义,学生是否会喝醉并互相呼吸,或者 a眨眼是某人眼中的沙砾调情。我们对“智能”的含义没有任何共识,但所有主要定义都包括“理解”,并且统计推断不会导致理解,即使它有时会近似。这样看:早在内燃机出现之前,人们就知道气体膨胀并了解活塞。但是,对于练习金属敲打的铁匠来说,内燃核心的受控爆炸所需的容差并不是真正可用的。最好的铁匠可以将金属锤成接近活塞的东西,也许可以将活塞精炼成功能性的东西,但前提是扔掉很多不合格的物品。由此产生的发动机将停止运行且不可靠,并且没有完全放弃金属敲打以支持铸造和(更重要的)机械加工等工艺的可靠性途径。

机器学习是金属打击。才华横溢的人用它做了非凡的事情。但是,如果我们只是在统计推理方面做得更好,意识就会从中消失的想法是一厢情愿的想法。这是科幻小说的前提,而不是未来的计划。科里·多克托罗 (Cory Doctorow) 是《离家出走》、《小兄弟》和《信息不想免费》(以及其他许多作品)的作者;他是 Boing Boing 的共同所有人,电子前沿基金会的特别顾问,开放大学计算机科学客座教授和麻省理工学院媒体实验室研究附属机构。评论员发表的所有意见仅代表他们自己的意见,并不反映 Locus 的意见。当您在这里时,请花点时间通过一次性或经常性捐赠来支持 Locus。我们依靠读者的捐款来维持杂志和网站的运行,并希望网站付费墙免费,但我们需要您的财务支持来继续高质量地报道科幻小说和幻想领域。