日本的第五代计算机系统:成功还是失败?

2021-08-02 23:16:58

这篇文章是对涉及该主题的论文内容的总结,大部分引用自 1983 年、1993 年和 1997 年的论文,并有一些版本,对现在和未来的引用取决于论文,但应该很容易推断。请参阅来源部分结尾。 1981 年,日本出现了名为第五代计算机系统 (FGCS) 的政府工业项目,这是出乎意料和戏剧性的。国际贸易和工业部 (MITI) 及其在电工实验室 (ETL) 的一些科学家计划了一个规模非凡的项目,预测技术上的大胆和对经济和社会的重大影响。这个项目激发了日本人的想象力(例如,Junichiro Uemae 的一本讲述其诞生的日文书名为“日本梦”)。它还引起了美国和欧洲的政府和计算机行业的注意,他们已经对日本对重要行业的收购持谨慎态度。 Feigenbaum 和 McCorduck 合着的《第五代》一书是这种关注的广泛阅读表现。日本的计划宏伟但不切实际,并立即被负责该项目的MITI规划人员和ETL科学家视为如此。

1982 年 5 月发布了修订后的规划文件,为第五代项目设定了更现实的目标。第四代:IBM E 系列,于 1979 年推出,以及其他使用超大规模集成电路的 VLSI,其计算能力大幅增加,但仍基于冯诺依曼架构,需要特定和精确的命令来执行任务。 FGCS 被设想为一台计算机,它可以利用它在其数据库中积累的知识,从不完整的指令中进行推断。 FGCS 基于一种不同于前四代计算机的架构,该架构由冯诺依曼发明并由 IBM 等进行商业开发。增加智能和易用性,使它们能够更好地帮助人类。使用语音、语音、图形、图像和文档进行输入和输出,使用日常语言,将知识存储到实际应用以及学习和推理能力中。减轻软件生成的负担,使高层次的需求规范足以进行自动处理,使程序验证成为可能,从而提高软件的可靠性。此外,必须改进编程环境,同时还应该可以使用现有的软件资产。提升整体功能和性能,满足社会需求。构建轻巧、紧凑、高速、大容量的计算机,能够满足日益多样化和适应性的提高,具有高度的可靠性和复杂的功能。

该项目的目标是实现新的计算机系统,以满足 1990 年代的预期要求。每个人都会在日常生活中不假思索地使用计算机。为此,必须创建一个环境,在该环境中,人和计算机可以轻松地使用多种信息媒体(例如语音、文本和图形)进行自由交流。智能界面功能必须能够处理自然语言、语音、图形和图像的人/机通信,以便信息可以以人类自然的方式进行交换。还将研究和开发专用硬件处理器和高性能接口设备,以有效执行语音、图形和图像数据的处理。将开发几个基本应用系统,以展示 FGCS 的有用性和系统评估。它们是机器翻译系统、咨询系统、智能编程系统和智能 VLSI-CAD 系统。在硬件中实现推理、关联和学习的基本机制,使其成为第五代计算机的核心功能。优势利用模式识别和人工智能研究成果,实现人机自然的人机界面。

有必要开发能够用作使用规则和断言来处理知识信息的核心处理器的高性能推理机。现有的人工智能技术已经发展为主要基于 LISP。然而,由于以下考虑,采用类似Prolog的逻辑编程语言作为软件和硬件之间的接口似乎更合适:VLSI技术的引入使得在硬件中实现高级功能成为可能;为了进行并行处理,需要采用适合并行处理的新语言;这些语言必须与关系数据模型有很强的亲和力。将研究和开发用于并行处理新知识库的并行处理硬件架构,该架构基于包含高性能分层存储系统的关系数据库机器,以及并行关系操作和知识操作的机制。由于关系数据模型与逻辑程序设计有很强的亲和力,知识库系统有望在第五代计算机系统中具有一些知识库设施的关系数据库机上实现。关系演算与一阶谓词逻辑关系密切。关系代数在描述查询方面具有与关系演算相同的能力。这些是将关系代数机视为知识库机器的主要候选者的原因。这种创新和大规模的研发在世界任何地方都没有先例。因此,我们将不得不通过漫长的试错过程向目标系统迈进,在此过程中产生许多独创的想法。对于 1990 年代在众多应用程序级别上使用的计算机,它们必须从以数值计算为中心的机器发展为能够评估信息的含义并理解要解决的问题的机器。

与数字数据相比,非数字数据(如句子、演讲、图表和图像)将被大量使用。预计计算机将主要在未来的应用中处理非数字数据。然而,目前的计算机在非数字数据处理方面的能力远低于数字数据处理能力。导致重新思考刚刚描述的传统计算机设计理念的必要性的关键因素包括: VLSI 的出现大大降低了硬件成本,并且允许使用尽可能多的硬件的环境将很快变得可行。要利用超大规模集成电路量产的效果,就必须追求并行处理。目前的计算机在处理语音、文本、图形、图像等非数值数据的基本功能,以及推理、联想、学习等人工智能类型的处理方面,表现极差。 FGCS的研发目标是解决问题和推理系统、知识库系统等知识信息处理的核心功能,这些功能在常规计算机系统的框架内是无法处理的。

随着 1992 年 6 月 1 日至 5 日在日本东京举行的第四代第五代计算机系统会议,一个时代结束了。从那时起十年过去了,ICOT 发展到大约 100 名研究人员,花费了大约 540 亿日元,约合 4.5 亿美元。在这十年中,已经构建了各种各样的机器,从专用 PSI 机器,即个人顺序推理机,到处理器和内存的多个星座,范围从 16 到 512 个处理元件共同形成 PIM 系列,即并行推理机。有些人反应过度,甚至谈到技术战争。今天又有人反应过度了。当他们看到他们的恐惧没有成为现实时,他们认为这个项目是失败的。 PIM 代表了一个研究并行符号计算权衡的机会,这在其他地方是不存在的。 KL1 是一种有趣的并行符号计算模型,但不太可能引起美国研究人员的想象。 PIMOS 在控制分配和通信方面有一些有趣的想法,美国研究人员应该认真评估。 ICOT 已经显示出非规则计算(即那些不适合矢量化流水线的数据并行性)的显着(即接近线性)加速。

ICOT 为人工智能、基于知识的系统和创新的计算机架构创造了积极的氛围。由于ICOT的存在,一些最优秀的年轻研究人员进入了这些领域。 ICOT 在推进基于知识的系统或人工智能本身的状态方面做得很少。 ICOT 在自然语言领域的目标要么被放弃,要么被转移到 EDR。 ICOT的努力与AI​​技术的商业应用几乎没有关系。语言的选择至关重要。 ICOT 的架构一直在商业上失败。需要开关编程模型和购买成本低的硬件。 ICOT 硬件落后于美国的硬件创新(例如 MIT LispMachine 及其后代和 MIT Connection Machine 及其后代)。早期的文件讨论了非常大的知识库、大规模自然语言理解和图像理解的管理,重点是知识的获取和学习。这些方向中的每一个似乎都已被放弃,降级为次要地位,被吸收到并行性工作中或转移到其他研究计划中。

ICOT 的工作往往是一个封闭的世界。在他们研究的这些连续和并行阶段,都开发了一种新语言,该语言只能在 ICOT 硬件上使用。此外,ICOT 硬件一直是实验性的,不符合成本效益。这阻止了ICOT技术对实际工作产生任何影响或丰富。值得注意的是,并行处理的概念很少受到关注,而事实证明,这个概念对整个项目非常重要。首先,在我看来,FGCS 项目的最初目标将其重点从上面描述的主要是知识信息处理系统 KIPS,在人机交互方面具有很强的能力,例如自然语言处理,转变为以下内容:将问题转化为该问题的解决方案的过程应该很简单。通过利用复杂的(并行处理)技术,计算机应该很快。日本确实证明了它有为世界其他地区带头的远见。他们采取了明智的行动,将成果提供给国际公众免费使用,从而成为造福人类而不仅仅是为了自身利益的领导者。 FGCS 项目的主要成果和成功之一是它对日本信息技术研发基础设施的影响。

ICOT的技术成果令人瞩目。考虑到方法的新颖性,缺乏背景,需要解决的困难,完成的工作量带来了一些有趣的东西,这纯粹是惊人的;这在硬件和软件中都是如此。远景的实现,应该说是搞“大计划”,造福社会,绝对不是项目启动时某些人所预期的水平。这对我来说一点也不意外,也就是说,我从来不相信这个宏伟计划中非常重要的部分可以成功解决。总体而言,该项目产生了重大的科学影响,促进了全世界有关如何构建高级计算系统的知识。我同意该项目的国际影响并不像一开始希望的那么大。我想我们所有相信这个项目的方向的人,即开发基于逻辑编程的集成并行计算机系统,都希望在 10 年的时间结束时,逻辑编程方法的优越性将毋庸置疑地展现出来,商业应用这项技术的进展顺利。不幸的是,情况并非如此。尽管 ICOT 已经达到了技术目标,但它开发的应用程序足以证明该方法的实用性,但不能证明其具有决定性的优越性。请注意,政府支持的工业财团可能无法“解读市场”,尤其是从长远来看。有远见。愿景很重要:人们需要一个伟大的梦想,让早上起床变得值得。然而,我期待在项目结束时看到某些技术的“实际使用”。这可能以三种方式发生。

第一种方法是拥有真实世界的应用程序,就用户而言;在现阶段只能看到其中的一小部分,尽管开发演示的努力不容小觑。第二个是为了计算机系统本身的利益。这似乎不会直接发生,至少现在不会,这令人失望,因为日本制造商至少作为人力资源提供者和分包商参与了 FGCS 项目。第三种方式是在研究发生的直接领域之外影响计算机科学:例如影响人工智能,影响软件工程等;目前还看不到很多,但有一些有希望的迹象。这个非凡项目的科学成就给我留下了深刻的印象。在我们的领域中,第一次通过单一语言实现硬件和软件设计的统一方法,即。 KL1。几乎令人难以置信的是,在大约两年半的时间里,有多少软件是直接或间接用 KL1 编写的。首先,语言本身是一种有趣的并行编程语言。 KL1 弥合了并行硬件和基于知识的应用程序之间的抽象差距。它也是一种旨在支持符号(与严格数字相反)并行处理的语言。它是一种扩展的逻辑编程语言,包括现实编程所需的功能(如数组)。但是,还应该指出的是,与许多其他逻辑编程语言一样,KL1 对一些贫困的牙友来说会显得很笨拙。

其次是为此类语言开发一套优化技术。 KL1 等语言的有效实现需要全新的编译器优化技术。第三个成就是注意到硬件在哪些方面可以在支持语言实现方面发挥重要作用。参与该项目的主要公司有富士通、日立、三菱电机、NEC、冲、东芝、松下电机工业和夏普。最常引用的原因是:ICOT 硬件成本高、选择 Prolog 作为语言以及对并行性的关注。然而,我们的主持人几乎经常提到 ICOT 的间接影响:建立一个以“第五代技术”为重点的国家项目引起了人工智能和知识型技术的极大关注。一些网站评论了这样一个事实,即这吸引了更好的人进入该领域,并为以前被视为深奥的事物增添了一种受人尊敬的光环。在项目的前 3 年阶段,构建了个人序列推理机 (PSI 1) 并为其开发了一个相当丰富的编程环境。

与 MIT 机器一样,PSI 是一种微程序处理器,旨在支持非符号处理语言。符号处理语言为机器发挥了广泛的“内核语言”的作用,涵盖从低级操作系统细节到应用软件的范围。硬件及其微代码旨在高效执行内核语言。这台机器是一个相当高性能的工作站,具有良好的图形、网络和复杂的编程环境。使PSI与众不同的是语系的选择。与面向数字处理的更传统的机器或面向 LISP 的 MIT 机器不同,为 PSI 选择的语言是 Prolog。为内核语言选择逻辑编程框架是一种激进的选择,因为基本上没有任何地方使用逻辑编程作为实现核心系统功能的框架的经验。在 ICOT 和合作设施中建造并安装了数百台 PSI 机器;而且这台机器也被商业化了。然而,即使与美国的专业 Lisp 硬件相比,PSI 机器也非常昂贵。 PSI(和其他 ICOT)机器有许多功能,其目的是支持实验,但其成本/收益权衡并未作为设计的一部分进行评估;这些机器本质上是非商业性的。第二个 3 年阶段见证了 PSI 2 机器的开发,它比 PSI 1 提供了显着的加速。在第 2 阶段即将结束时,构建了一个并行机器(多 PSI)以允许对 FGHC 范式进行实验。这包括一个 8 × 8 网格的 PSI 2 处理器,运行 ICOTFlat Guarded Horn Clause 语言 KL1。所有 PIM 的抽象模型由松散耦合的网络连接紧密耦合的处理器集群组成。每个集群实际上都是一个共享内存多处理器;集群中的处理器共享内存总线并实现缓存一致性协议。其中三个 PIM 是大型并行机。即使承认 PIM 处理器芯片的特殊架构特性可能会导致显着的加速(说 3 倍是非常慷慨的),但与商业最先进的技术相比,这些芯片令人失望。另一个性质完全不同的最重要的问题是,ICOT 是否明智地将如此多的精力集中在构建用于逻辑编程的专用硬件上,而不是构建或使用现成的、不针对任何特定用途的通用硬件。语言或编程范式。设计专用实验硬件的问题在于,任何可以获得的性能优势很可能会被商用机器(顺序和并行)的持续快速发展所取代。 ICOT 的 PSI 机器现在即使没有通过先进的 RISC 处理器在 Prolog 和 CCL 性能方面得到改善,也可以与之匹敌。

许多人对专用处理器和语言专用机器的需求持怀疑态度。 LISP 机器失败,因为 LISP 与通用机器上的良好编译器一样快或几乎一样快。PSI 机器肯定没有市场,因为最新的 Prolog 编译器,编译成 RISC 指令并使用抽象解释来帮助优化代码,提供可比的性能。将 PIM 与 Thinking Machines Inc. 的 CM-5 进行比较很有趣;这是一个大规模并行机器,它是麻省理工学院 ConnectionMachine 项目的后代。 CM-5 是该开发线中的第三款商用机器。虽然连接机项目......