谷歌使用加强学习设计下一代AI加速器芯片

2021-06-10 08:56:26

在一年前发布的预印章中,谷歌研究包括谷歌AI Lead Jeff Dean的科学家介绍了一种基于AI的芯片设计方法,可以从过去的经验中学习并随着时间的推移而改善,在为看不见的组件产生架构方面变得更好。他们声称它平均完成了六个小时内的设计,这比环路中的人类专家所需的时间更快。

虽然这项工作并不完全是新颖的 - 它建立在一项技术上,谷歌工程师在3月2020年3月发布的一篇文章中 - 它提出了本领域的技术,因为它暗示了片上晶体管的放置可以很大程度上自动化。现在,在发表于本质上的论文中,谷歌研究人员的原始团队声称他们可以微调设计即将到来的技术,以前未经发改的谷歌的张力处理单元(TPU),特定于应用的集成电路(ASICS )专门开发,用于加速AI。

如果公开可用,谷歌研究人员的技术可以使现金陷入困境的初创公司为AI和其他专业目的开发自己的筹码。此外,它可以帮助缩短芯片设计周期,以允许硬件更好地适应快速发展的研究。

“基本上,现在在设计过程中,您有设计工具可以帮助做一些布局,但您有人类的安排和路由专家与这些设计工具一起使用,这些工​​具可以迭代许多迭代,”迪恩在A中讲述了Venturebeat以前的面试。 “这是一个多周期的过程,实际上从设计中实际上要实际上,它实际上是在芯片上物理放置的,在区域和电源和电线长度和电线长度和符合您正在做的所有设计角色或任何制造过程中。我们基本上有一个机器学习模型,可以学习为特定芯片进行[组件]放置的游戏。“

计算机芯片被分成几十个块,每个块是单独的模块,例如存储器子系统,计算单元或控制逻辑系统。这些线连接块可以由网表来描述,电路组件的曲线图如存储器组件和包括逻辑门(例如,NAND,NOR和XOR)的标准单元。芯片“平面图”涉及将网表放置到称为画布的二维网格上,以便优化功耗,时序,区域和Wirelengt等性能度量,同时遵守密度和路由拥塞的约束。

自20世纪60年代以来,已经提出了许多自动化芯片地板平面的方法,但没有实现人类水平的性能。此外,芯片复杂性的指数增长使得这些技术在现代芯片上提供了不可用的技术。人类芯片设计师必须使用电子设计自动化(EDA)工具迭代几个月,采用芯片网列表的寄存器传输级别(RTL)描述,并在芯片画布上生成手动放置该网手册。在此反馈的基础上,最多可能需要72小时,设计人员要么结束,所以已经实现了设计标准或向上行RTL设计人员提供反馈,然后修改低级代码以使放置任务更容易。

谷歌团队的解决方案是一种能够穿越芯片的强化学习方法,这意味着它可以从经验中学习更好,更快地放置新筹码。

培训AI驱动的设计系统概括芯片呈现挑战性,因为它需要学习优化所有可能的芯片网手册的放置到所有可能的帆布上。在事实上,芯片平面图类似于具有各种各样的游戏(例如,网表拓扑,宏观计数,宏观尺寸和纵横比),板(Canvas尺寸和纵横比)以及赢得条件(不同评估的相对重要性指标或不同的密度和路由拥塞约束)。即使是这个“游戏”的一个实例 - 将特定网表放到特定的画布上 - 比中国棋盘游戏更有可能的移动。

研究人员的系统旨在将逻辑门,内存和更多的“网表”图放在芯片画布上,使得设计优化功率,性能和面积(PPA),同时遵守放置密度和路由拥塞的约束。图表的大小从数百万到数十亿个节点中分组,通常,评估目标度量值从小时到一天中。

从空芯片开始,Google团队的系统顺序地将组件依次汇总,直到它完成网表。要引导系统选择首先放置哪些组件,组件通过降序来排序;放置较大的组件首先减少了稍后没有可行的放置。

培训系统所需的系统创建10,000个芯片展示位置的数据集,其中输入是与给定放置相关的状态,标签是放置的奖励(即,Wirelength和拥塞)。研究人员通过首先选择五个不同的芯片网师,应用AI算法以为每个网表创建2,000个不同的放置。

该系统在NVIDIA Volta显卡和10个CPU上拍摄了48小时才能在NVIDIA Volta显卡和10个CPU上,每个CPU有2GB的RAM。微调最多需要长达6个小时,但将预先训练的系统应用于新的网表,而在稍后的基准测试中,在单个GPU上的单个GPU上的少于一秒钟,在不到一秒钟的时间内产生的放置。

在一次测试中,谷歌研究人员将系统的建议与手动基线进行了比较:由Google的TPU物理设计团队创建的上一代TPU芯片的生产设计。系统和人类专家都一致产生了可行的放置,符合时序和拥塞要求,但AI系统也在面积,电源和Wirelength中表现出或匹配的手动放置,同时达到更少的时间来满足设计标准。

谷歌表示,其系统概括和生成“高质量”解决方案的能力具有“重大影响”,解锁了与芯片设计过程的早期阶段共同优化的机会。大规模的建筑探索以前是不可能的,因为需要几个月的努力来评估给定的建筑候选人。然而,修改芯片的设计可以对性能进行扩展影响,谷歌团队说明,并且可能为芯片设计过程的完整自动化奠定了基础。

此外,由于Google团队的系统只是学习将图形的节点映射到一组资源上,因此可能适用于包括城市规划,疫苗测试和分布和大脑皮层映射的应用范围。 “[虽然]我们的方法已被用于制作来设计下一代Google TPU ... [我们]相信[IT]可以应用于芯片设计之外的影响力的放置问题,”研究人员在论文中写道。 VidtureBeat' S使命是成为技术决策者的数字城市广场,以获得有关转型技术和Transact的知识。您网站提供有关数据技术和策略的基本信息,以指导您的领导您的组织。 我们邀请您成为社区的成员,访问:门控思想领导者内容和对我们奖化事件的折扣访问,如转换2021:了解更多 成为会员