尽管FPGA本身不如CPU强大,但是FPGA可以出色地完成特定任务。无论是加速充当大规模数据中心服务的架构以提高AI性能,一位有能力的工程师手中的FPGA都可以减轻CPU的各种任务负担,并加快处理速度。过去六年来,英特尔一直在谈论将Xeons与FPGA集成的大型游戏,但是它并没有导致单一产品进入其阵容。不过,AMD的一项新专利可能意味着FPGA新手可能已经准备好自己制造一个。 10月,AMD宣布了收购Xilinx的计划,这是对数据中心的重大推动的一部分。周四,美国专利商标局(USPTO)发布了一项AMD专利,该专利将可编程执行单元与CPU集成在一起。 AMD在其专利申请中提出了20项主张,但要点是处理器可以包括一个或多个执行单元,可以对这些执行单元进行编程以处理不同类型的定制指令集。这正是FPGA的功能。在我们看到基于此设计的产品之前,可能要花点时间,因为要成为最近的EPYC泄漏中包含的CPU的一部分似乎还为时过早。尽管AMD为其Zen 2和Zen 3处理器的小芯片设计引起了轰动,但这似乎并不是这里发生的事情。实际上,AMD的FPGA专利中的可编程单元与处理器的浮点和整数执行单元共享寄存器,如果它们不在同一位置,将很困难,或者至少很慢。包。这种集成应该使开发人员可以轻松地将这些自定义指令编织到应用程序中,而CPU只是知道将这些指令传递到处理器FPGA上。这些可编程单元可以处理非典型数据类型,特别是用于加快AI训练和推理速度的FP16(或半精度)值。在有多个可编程单元的情况下,每个单元可以用不同的专用指令集编程,因此处理器可以加速多个指令集,并且这些可编程EU可以即时进行重新编程。这个想法是,当处理器加载程序时,它还会加载一个位文件,该文件配置可编程执行单元以加速某些任务。 CPU自己的解码和分配单元可以寻址可编程单元,传递那些要处理的定制指令。多年来,AMD一直在努力以不同的方式来加快AI计算的速度。首先,该公司宣布并发布了Radeon Impact系列AI加速器,它们只是具有自定义驱动程序的大型无头Radeon图形处理器。该公司通过在2018年Radeon RX 5000系列发布之前推出其首个7纳米GPU MI60来发布MI60。 ;很高兴看到公司提出了什么。