人工智能背后的基础理论

2020-05-24 03:38:18

人工智能是一个非常热门的话题已经有一段时间了。在过去十年的某个时候,我不确定引爆点到底是什么时候,科技界开始真正模糊了科幻和现实之间的界限。汽车学会了自动驾驶,机器人开始送外卖,手表开始像詹姆斯·邦德(James Bond)玩具一样,虚拟家庭助理坐着准备回答我们能想到的任何问题。

至少可以说,人工智能的影响既迅速又巨大,但它是如何走到今天这一步的呢?人工智能最初的目标是什么,是什么技术推动了它的进步?是什么让人工智能走出科幻小说,走进我们的起居室?

人工智能领域的历史比你想象的要早得多-一直追溯到20世纪50年代。1955年8月,约翰·麦卡锡(达特茅斯)、马文·李·明斯基(哈佛大学)、纳撒尼尔·罗切斯特(IBM)和克劳德·埃尔伍德·香农(贝尔电话实验室)完成了“达特茅斯人工智能夏季研究项目提案”,正式创造了这个术语,并点燃了我们今天所知的人工智能的第一个火花。

该提案概述了这四人认为阻碍进步的问题,他们迄今的相关经验,以及对研究项目的期望。四位创始人认为,总的来说,他们可以在两个月内取得“重大进展”,只要房间里有合适的10个人,就能拿到惊人的13,500美元。对夏季的展望是这样描述的:

“这项研究是建立在这样一个猜想的基础上进行的,即原则上可以如此精确地描述学习的每一个方面或任何其他智能特征,以至于可以制造一台机器来模拟它。”我们将尝试找出如何让机器使用语言,形成抽象和概念,解决现在留给人类的各种问题,并改进自己。我们认为,如果精心挑选的一群科学家一起工作一个夏天,就可以在这些问题中的一个或多个方面取得重大进展。“。

为了理解研究项目的设计,我们必须首先了解它被设计用来解决什么问题和实现什么成就(请原谅我-我们需要一些背景才能进一步理解任何事情,但我会尽可能地让它变得轻松)。关于“人工智能问题”,最初概述的要点如下:

我强烈建议阅读他们对每一项的简要总结(可以在原始提案的第二页找到),但即使不阅读,其中一些可能对您来说也很熟悉。在这里,在人工智能的第一次讨论中,我们看到了神经元网络(现在与神经网络/深度学习相关),自我完善(当今机器学习领域的一个重要目标),以及自动计算机(计算限制和我们作为工程师充分优化能力的能力的问题)。

每个创始成员都带来了独特的专业知识,所有这些专业知识都可以针对上面的特定问题。

Claude Shannon有设计“学习的机器”的背景,并且有丰富的使用图灵机理论的经验(如果您不熟悉这个理论,我建议您简要查阅一下斯坦福哲学百科全书中有关它的条目)。香农是解决该领域自我完善问题的完美人选。

马文·李·明斯基(Marvin Lee Minsky)已经在普林斯顿大学(Princeton)写了一篇关于神经网络的博士论文,题目是“神经网络和大脑模型问题”。已经用神经网络建造了一台学习机,他可以专注于神经元网络问题。

纳撒尼尔·罗切斯特(Nathaniel Rochester)和另一位IBM工程师被誉为当时最受欢迎的大型自动计算机之一,称为IBM701型。这种知识,再加上他在构建使计算机能够执行人工任务的技术方面的经验,将使罗切斯特在解决自动计算机和编程计算机使用语言的问题方面处于有利地位。

约翰·麦卡锡(John McCarthy),他的工作主要围绕数学问题及其与人类思维过程的关系展开。两者都让他对前方的路障有了一个很好的整体视角,对人工智能的随机性和创造性问题都有很大的价值。

现在,我并不是说他们每个人都只致力于解决列出的问题-实际上,你可以从他们提案的第五页开始,阅读每个团队成员关于他的重点和意图的单独写作。相反,我发现他们的专业知识清楚地说明了为什么这个团队准备好回答如此复杂的问题。

正如我们早先看到的,最初提案中讨论的大部分内容都让人想起目前围绕人工智能的对话。事实上,正是这些原创想法中的一些进步使得谷歌、亚马逊和苹果等公司能够建立他们的人工智能技术。

在最基本的层面上,神经网络是一套算法-但这有点像是说人类的大脑是原子的集合。不过,算法是构建块,而这些算法组是专门(松散地)在人脑上建模的。

神经网络可以包括数千个甚至数百万个独立的、复杂互连的处理节点。这些节点被设计成识别模式,就像人脑一样。神经网络的进步使深度学习领域的进步成为可能-深度学习是机器学习的一个分支,也是现代人工智能的组成部分。

如果我必须指着一块地说,“就是这样。这就是现代人工智能成为可能的原因,“它将是机器学习。机器学习是计算机可以从经验中学习的想法。这些算法使用统计数据和大量数据来识别和利用模式。

你可能听说过今天困扰互联网用户的许许多多隐私问题。我们都知道为什么公司想要获取我们的数据-资金。但是我的数据如何转换成美元和美分呢?一些公司出售数据牟利。然而,其他人将所有的数据-每次鼠标点击,每次观看的视频,视频被观看的时间长度,视频结束后我下一步去哪里,等等-都输入到这些算法中。这些高度复杂、经过完美调整的算法消化了所有这些模式,从而创建了对用户行为的惊人准确的预测。对这些数据的摄取和分析是我们如何获得关于下一步要看什么的建议,并最终观看几个小时、几个小时、几个小时的过程。

如果这还不够复杂,深度学习是机器学习的一个更复杂、更进化的版本。它涉及最复杂的神经网络,能够捕捉到最微妙的行为模式。

如果你曾经听到你的MacBook Air在Netflix长时间狂欢之后开始发出奇怪的声音并开始升温,你可能会问自己,这种类型的计算到底是怎么可能的。在很长一段时间里,它根本就不是。

上图是一张1995年的MacBook的照片。现在想想你现在正在用什么设备阅读这篇文章,想想我们已经走了多远,即使是在我的有生之年。这一壮举令人肃然起敬。现在想想,自从麦卡锡、明斯基、罗切斯特和香农在达特茅斯度过暑假以来,我们已经走了多远。狂野。

计算能力的这些进步对人工智能的成功至关重要。要运行人工智能所需的机器学习算法,需要难以置信的计算能力。有些人没有意识到这一点,但计算能力是技术限制的一个重要来源。例如,现代密码指南和加密之所以是安全的,只是因为我们没有能够暴力破解它们的计算机(目前还没有)。当然,要做到这一点需要数十亿年的时间,但这是基于今天的计算能力。随着计算机变得更强大,这条时间线就会缩短。

上述一切实际上都可以归结为一件事:数据。存在的超乎想象的海量用户数据是人工智能这艘火箭飞船上的燃料。是的,如果没有神经网络、机器学习和能够同时运行两者的计算机,这些数据将相对无用。

但数据才是机器真正学习的东西。机器得到的越多,它就变得越聪明--它的知识越精炼,它的预测就越准确。当我们想到人工智能时,我们想到的每一件事,无论是与我们的谷歌主页交谈,还是在看到你今天早上想到的东西的广告时感到毛骨悚然,都源于对如此庞大的数据集的分析,它们可以猜测如何成功地与你互动。也许下次当Siri不知道如何回应时,你会对她好一点。

我不会假装知道人工智能的未来会是什么样子。我要说的是,我们才刚刚开始看到它对我们世界的影响,虽然如果谷歌错误地处理了我的Spotify请求,风险是微不足道的,但当我们开始谈论医疗建议、财务处理、教学等时,情况就完全不同了。此外,争取更多数据隐私的斗争正在如火如荼地进行,持续涌入的数据对于进一步的进步至关重要。随着算法和计算机的进步,他们将能够用更少的钱做更多的事情。但是,它们仍然需要燃料。