我仿佛世界已经创造了第二个中国,它不是由数十亿人和数百万家工厂组成,而是由算法和嗡嗡作响的计算机组成。专业服务公司W预测,到2030年,人工智能将为全球经济增加16万亿美元。2018年,世界第二大经济体的所有活动-从银行和生物技术到商店和建筑-的总额仅为13万亿美元。
W的说法并不是异常值。麦肯锡(McKinsey)的竞争对手预测者认为这一数字为13万亿美元。其他人则喜欢定性的戏剧性,而不是定量的。谷歌老板桑达尔·皮查伊(Sundar Pichai)曾将“比火或电更深远”的发展描述为“比火或电更深刻”。其他预测也看到了类似的巨大变化,但不太令人高兴。能够完成放射科医生、卡车司机或仓库工人工作的智能计算机可能会导致一波失业浪潮。
然而,最近人们开始怀疑今天的技术是否真的像它看起来那样改变世界。它正在遭遇这样或那样的限制,并且未能兑现其支持者的一些更宏伟的承诺。
毫无疑问,或者说,机器学习,它的一个子领域-已经取得了很大的进步。计算机在许多他们以前苦苦挣扎的事情上已经有了惊人的进步。这种兴奋在2010年代初开始在学术界积累起来,当时新的机器学习技术导致了识别图片和操纵语言等任务的迅速改进。从那时起,它蔓延到商业领域,从互联网巨头开始。凭借巨大的计算资源和海量数据,他们处于采用这项技术的有利地位。现在,现代技术为搜索引擎和语音助手提供动力,建议回复电子邮件,为解锁智能手机和监管国家边境的面部识别系统提供动力,并为试图识别社交媒体上不受欢迎的帖子的算法提供支持。
或许这项技术潜力最引人注目的展示出现在2016年,当时谷歌母公司Alphabet旗下的伦敦公司DeepMind开发的一个系统,在围棋这款古老的亚洲棋类游戏中击败了世界上最好的棋手之一。数千万人观看了这场比赛;突破性的到来比古鲁们预期的要早几年,甚至几十年。
正如皮查伊先生与电和火的比较所表明的那样,机器学习是一种通用技术--一种能够影响整个经济的技术。它擅长识别数据中的模式,这在任何地方都很有用。鸟类学家用它来分类鸟鸣;天文学家用它在星光下寻找行星;银行用它来评估信贷风险和防止欺诈。在荷兰,当局用它来监控社会福利支出。在中国,面部识别可以让顾客购买食品杂货,并帮助运行国家在穆斯林占多数的新疆建立的压制性大规模监控系统。
的宣传员说,进一步的转变还在后头,无论是好是坏。2016年,对现代做出根本性贡献的计算机科学家杰弗里·辛顿(Geoffrey Hinton)表示,“很明显,我们应该停止培训放射科医生”,理由是计算机很快就能做它们所做的一切,只会更便宜、更快。与此同时,自动驾驶汽车的开发商预测,机器人出租车将给交通带来革命性的变化。谷歌前董事长、“经济学人”母公司前董事会成员埃里克·施密特(Eric Schmidt)希望这能加速研究,帮助人类科学家跟上铺天盖地的论文和数据。
今年1月,一组研究人员在“细胞”杂志上发表了一篇论文,描述了一个从分子结构预测抗菌功能的系统。该系统选择了100个候选分子进行进一步分析,其中一个被证明是一种有效的新抗生素。新冠肺炎的大流行将这种医疗应用牢牢地推到了聚光灯下。一家名为蓝点(BlueDot)的公司声称,早在12月,他们就在中国医院的报告中发现了一种新型病毒的迹象。研究人员一直在争先恐后地尝试将其应用于从药物发现到解释医学扫描和预测病毒可能如何进化的方方面面。
这并不是第一波相关的兴奋(参见下一篇文章的时间表)。该领域始于20世纪50年代中期,当时研究人员希望建立人类水平的智能需要几年-最多几十年。到了20世纪70年代,这种早期的乐观情绪已经泡汤了。第二波开始于20世纪80年代。这一领域最宏伟的承诺又一次没有兑现。随着现实取代了炒作,繁荣让位于被称为“冬天”的痛苦萧条。研究资金枯竭,该领域的声誉受损。
关于人工智能的许多最宏伟的说法再次未能成为现实。
现代技术要成功得多。数十亿人每天在智能手机和互联网服务中使用它,但大多没有注意到。然而,尽管取得了这样的成功,但事实仍然是,关于这项技术的许多最宏伟的声明再次未能成为现实,随着研究人员开始怀疑这项技术是否遇到了障碍,信心正在动摇。自动驾驶汽车已经变得更有能力,但永远处于足够安全的边缘,可以部署在日常街道上。同样,将其纳入医疗诊断所需的时间也比预期的要长:尽管辛顿博士做出了预测,但全球仍然缺乏人类放射科医生。
心脏病专家和热心人士埃里克·托波尔(Eric Topol)在2019年调查了医疗领域,他写道,“炒作的状态已经远远超过了科学的状态,特别是当它涉及到验证和准备在患者护理中实施的时候”。尽管有太多的想法,新冠肺炎的战斗大多是用手头已经有的旧武器。人们已经通过鞋皮和电话进行了接触追踪。临床试验的重点是现有的药物。人行道上的塑料屏风和油漆强制执行低技术的距离建议。
同样预测这将产生改变世界影响的顾问们也报告说,真实公司的真正管理者发现很难实施,而且对此的热情正在降温。研究公司Gartner的斯维特拉娜·西西卡拉(Svetlana Sinular)表示,2020年可能是她的公司广为人知的“炒作周期”走下坡路的一年。投资者开始意识到潮流的跳跃:风险投资基金对欧洲初创公司的一项调查发现,40%的公司似乎根本没有使用过任何公司。一位分析师小心翼翼地表示:“我认为‘投资者营销’肯定有很强的因素。”
本期“科技季刊”将探讨人们热情停滞的原因。它会争辩说,虽然现代技术很强大,但它们也是有限的,而且它们可能会带来麻烦和难以部署。那些希望利用其潜力的人必须面对两组问题。
第一个是切合实际的。机器学习革命建立在三件事上:改进的算法,运行算法的更强大的计算机,以及-多亏了社会的逐渐数字化-更多的数据可以供他们学习。然而,数据并不总是容易获得。例如,如果没有一个全面的每个人活动的数据库,就很难用来监控新冠肺炎的传播。即使数据确实存在,它们也可能包含隐藏的假设,这些假设可能会让粗心大意的人绊倒。最新的系统对计算能力的需求可能会很昂贵。大型组织总是需要时间来整合新技术:想想20世纪的电力或21世纪的云。所有这些都不一定会降低其潜力,但会减缓其被采用的速度。
第二组问题涉及更深层次的问题,涉及算法本身。机器学习使用数千或数百万个示例来训练软件模型(其结构松散地基于大脑的神经架构)。由此产生的系统可以完成一些任务,比如识别图像或语音,比那些用传统方式用手工制定的规则编程的系统要可靠得多,但它们并不像大多数人理解的那样“智能”。它们是强大的模式识别工具,但缺乏许多生物大脑认为理所当然的认知能力。他们努力进行推理,从他们发现的规则中进行概括,并与研究人员由于缺乏更准确的描述而被称为“常识”的通用型洞察力作斗争。其结果是一个人造的白痴学者,它可以在有良好边界的任务上出类拔萃,但如果面对意想不到的输入,可能会犯下很大的错误。
如果没有另一次突破,这些缺点将从根本上限制能做什么和不能做什么。必须在不断变化的世界中导航的自动驾驶汽车已经被延误,而且可能永远不会到达。与语言打交道的系统,如聊天机器人和个人助理,都是建立在统计方法上的,这些方法产生了肤浅的理解,而不是现实。这将限制它们的用处。对智能计算机使放射科医生或卡车司机过时的存在主义担忧似乎被夸大了,更不用说像一些末日论者所说的那样,对人类的生存构成威胁了。有关中国经济价值额外增长的预测看起来是不可信的。
今天的“夏天”不同于以往的“夏天”。它更明亮、更温暖,因为这项技术已经得到了如此广泛的部署。另一个全面的冬天不太可能到来。但是,秋风正在吹起。。
这篇文章发表在印刷版的“技术季刊”栏目中,标题为“现实检查”。