我们很容易把头脑想象成一个位于更原始的认知结构之上的一层。毕竟,作为有意识的存在,我们体验自己的方式与我们心跳的节奏或胃的隆隆声不同。如果大脑的运作可以被分离和分层,那么也许我们可以构建一些类似于顶层的东西,实现类似人类的人工智能(AI),同时绕过以有机生命为特征的凌乱的肉体。
我理解这种观点的吸引力,因为我与人共同创立了SwiftKey,这是一家被微软收购的预测性语言软件公司。我们的目标是模仿人类理解和操纵语言的非凡过程。我们已经取得了一些不错的进展:我对我们在2012年至2014年间为物理学家斯蒂芬·霍金建造的优雅的新通信系统感到相当自豪。但是,尽管取得了令人鼓舞的结果,但大多数情况下,我被提醒,我们距离实现类似人类的人工智能还很遥远。为什么?因为认知的分层模型是错误的。大多数人工智能研究人员目前都遗漏了拼图的核心部分:化身。
早在20世纪50年代,现代人工智能开始时,事情就出现了错误的转折。计算机科学家决定通过建立基于符号的逻辑系统来模仿有意识的推理。该方法包括将真实世界实体与数字代码相关联,以创建环境的虚拟模型,然后将其投影回世界本身。例如,通过使用符号逻辑,您可以指示机器通过使用诸如“猫是动物”之类的数学公式对特定知识进行编码,从而“学习”猫是一种动物。这样的公式可以被汇总成更复杂的语句,允许系统操纵和测试命题-比如你的普通猫是否和马一样大,或者是否可能追逐老鼠。
这种方法在简单的人工环境中获得了一些早期的成功:在麻省理工学院的计算机科学家特里·维诺格拉德(Terry Winograd)在1968-1970年间创建的虚拟世界“shresdlu”中,用户可以与计算机交谈,以便在圆锥体和球等简单的块状物体周围移动。但是,当面对现实世界的问题时,符号逻辑被证明是无可救药的不足,在现实世界中,微调的符号在模糊的定义和千变万化的解释面前崩溃了。
在后来的几十年里,随着计算能力的增强,研究人员转向使用统计学从大量数据中提取模式。这些方法通常被称为“机器学习”。机器学习不是试图编码高级知识和逻辑推理,而是采用自下而上的方法,其中算法通过重复任务来识别关系,例如将图像中的可视对象分类或将录制的语音转录成文本。这样的系统可能会学会识别猫的图像,例如,通过查看数百万张猫的照片,或者根据猫和老鼠在大段文字中被引用的方式在它们之间建立联系。
近年来,机器学习产生了许多巨大的实际应用。我们已经建立了在语音识别、图像处理和唇读方面超过我们的系统;可以在国际象棋上击败我们的系统,危险!他们正在学习创造视觉艺术,创作流行音乐,并编写自己的软件程序。在某种程度上,这些自学算法模仿了我们对有机大脑潜意识过程的了解。机器学习算法从简单的“特征”(例如,单个字母或像素)开始,然后将它们组合成更复杂的“类别”,并考虑到现实世界数据中固有的不确定性和模糊性。这有点类似于视觉皮层,它接收来自眼睛的电信号,并将其解释为可识别的图案和物体。
但是,算法距离能够像我们一样思考还有很长的路要走。最大的区别在于我们进化的生物学,以及生物学是如何处理信息的。人类由数万亿真核细胞组成,大约25亿年前首次出现在化石记录中。人类细胞是一种非凡的联网机器,它的组件数量与现代大型喷气式飞机大致相同-所有这些都源于与自然界长期的、嵌入式的接触。在“盆地与山脉”(1981)一书中,作家约翰·麦克菲(John McPhee)观察到,如果你张开双臂来代表地球的整个历史,复杂的生物体只会在远手腕开始进化,而“只需用一把中等粒度的指甲锉,你就可以消灭人类历史”。
传统的进化观认为,我们的细胞复杂性是从早期的真核生物通过随机基因突变和选择进化而来的。但在2005年,芝加哥大学的生物学家詹姆斯·夏皮罗(James Shapiro)概述了一种激进的新说法。他争辩说尤卡约
现在,从智能的、自组织的细胞到我们这里所担心的那种大脑智能,这是一个小小的飞跃。但问题是,早在我们有意识、有思维的生物出现之前,我们的细胞就已经从环境中读取数据,并共同努力将我们塑造成强大的、自我维持的力量。那么,我们所认为的智能,并不是简单地用符号来表现客观的世界。相反,我们只有展现给我们的世界,它植根于我们作为一个有机体进化的、具体化的需求。神经科学家安东尼奥·达马西奥(Antonio Damasio)在他关于认知的开创性著作“笛卡尔的错误”(1994年)中写道,大自然“不仅在生物调节机制的基础上建立了理性机制,而且还从它和随之而来的机制中建立了理性机制”。换句话说,我们用我们的整个身体思考,而不仅仅是用大脑。
我怀疑,在不确定的世界中肉体生存的这一基本要求,是人类智力灵活性和力量的基础。但很少有人工智能研究人员真正接受这些见解的含义。大多数人工智能算法的动机是从大量的训练数据中推断模式-所以可能需要数百万甚至数十亿张单独的猫照片才能在识别猫方面获得高度的准确性。相比之下,由于我们作为有机体的需要,人类在其更广阔的环境中携带着极其丰富的身体模型。我们根据经验和预期,从相对较少的观察样本中预测可能的结果。因此,当一个人想到一只猫时,她很可能能想象出它移动的样子,听到咕噜声,感觉到一只脱壳的爪子即将发出的抓痕。她拥有丰富的感官信息,可以用来理解“猫”的概念,以及其他可能帮助她与这种生物互动的相关概念。
这意味着当一个人处理一个新问题时,大部分艰苦的工作已经完成了。以我们刚刚开始理解的方式,我们的身体和大脑,从细胞水平向上,已经建立了一个世界模型,我们几乎可以立即将其应用于各种挑战。但对于人工智能算法来说,这个过程每次都是从头开始的。有一个活跃而重要的研究领域,被称为“归纳迁移”,专注于利用先前的机器学习知识来提供新的解决方案。然而,就目前的情况来看,这种方法是否能够捕捉到我们自己身体模型的丰富性,这是值得怀疑的。
就在2014年SwiftKey揭开霍金新通信系统面纱的同一天,他接受了BBC的采访,他在采访中警告称,智能机器可能会终结人类。你可以想象哪个故事最终占据了头条新闻。我同意霍金的观点,我们应该认真对待流氓人工智能的风险。但我相信,我们还远远不需要担心任何接近人类智能的东西-除非我们仔细考虑如何让算法与其环境建立某种长期的、具体化的关系,否则我们实现这一目标的希望微乎其微。