周四,亚马逊AWS的一篇博文宣布,该公司已经将其Alexa个人助理的大部分云处理从Nvidia GPU转移到自己的Inferania和专用集成电路(ASIC)上。亚马逊开发人员Sebastien Stormacq介绍了Inferania的硬件设计如下:
AWS Inferania是一款定制芯片,由AWS构建,用于加速机器学习推理工作负载并优化其成本。每个AWS Inferania芯片包含四个独立的NeuronCore。每个NeuronCore都实现了高性能的脉动阵列和矩阵乘法引擎,大大加快了卷积和变换等典型深度学习操作的速度。NeuronCores还配备了大型片上高速缓存,这有助于减少外部存储器访问,从而显著缩短延迟并提高吞吐量。
当亚马逊的客户--通常是拥有Echo或Echo圆点的人--使用Alexa个人助理时,设备本身的处理过程很少。典型Alexa请求的工作负载如下所示:
一个人类对亚马逊的回声说:亚历克莎,格雷伯爵茶中的特殊成分是什么?
在亚马逊数据中心内,语音流被转换为音素(推理AI工作负载)。
意图被路由到适当的履行服务,该服务以JSON文档的形式返回响应。
自然语音音频回传到Echo设备进行播放--这是它的佛手柑橘子油。
正如您所看到的,在满足Alexa请求时,几乎所有的实际工作都发生在云中--而不是在Echo或Echo Dot设备本身。绝大多数的云计算工作不是由传统的如果-那么逻辑完成的,而是推理--这是神经网络处理中提供答案的那一面。
根据Stormacq的说法,将推断工作从Nvidia GPU硬件转移到亚马逊自己的Inferania芯片上,使得Alexa的文本到语音工作负载的端到端延迟降低了30%,端到端延迟缩短了25%。亚马逊并不是唯一一家使用Inferania处理器的公司,该芯片支持亚马逊AWS Inf1实例,这些实例面向普通大众,与亚马逊搭载GPU的G4实例展开竞争。
亚马逊的AWS Neuron软件开发包允许机器学习开发者使用Inferania作为流行框架的目标,包括TensorFlow、PyTorch和MXNet。
当我刚开始从事计算机行业时,大多数大公司都是自己制造硅的,而且大部分都是基于RISC的。IBM有自己版本的PowerPC芯片。当然是太阳。Sun拥有SPARC处理器。惠普有自己的PA-RISC芯片。这就是你从竞争对手中脱颖而出的原因。他们一个接一个地放弃了芯片,转而采用英特尔的i86CISC架构。苹果是2007年最后一家这样做的公司。他们这样做的原因都是一样的:尽管RISC应该更快、更高效,但英特尔有足够的力量从被认为是劣质的架构中挖掘出性能。英特尔拥有的最大优势是巨大的销售额和利润。惠普只能卖出几千块PA-RISC芯片。太阳可能有几万个。PowerPC被IBM抛弃了,苹果是主要客户,可能会有100万左右。英特尔的销售额高达数亿美元,可以将这笔钱直接投入研发,以制造更快、更强大的芯片。没有人能与之竞争。苹果和亚马逊拥有数十亿部iPhone和数十亿台AWS服务器,它们有足够的规模将所需的巨额资金投入到定制芯片的研发中。因此,在20年来定制RISC让位于英特尔的i86 CISC芯片之后,我们现在再次看到定制硅和RISC的增长。我想知道微内核是否会卷土重来。
当我刚开始从事计算机行业时,大多数大公司都是自己制造硅的,而且大部分都是基于RISC的。IBM有自己版本的PowerPC芯片。当然是太阳。Sun拥有SPARC处理器。惠普有自己的PA-RISC芯片。这就是你从竞争对手中脱颖而出的原因。他们一个接一个地放弃了芯片,转而采用英特尔的i86CISC架构。苹果是2007年最后一家这样做的公司。他们这样做的原因都是一样的:尽管RISC应该更快、更高效,但英特尔有足够的力量从被认为是劣质的架构中挖掘出性能。英特尔拥有的最大优势是巨大的销售额和利润。惠普只能卖出几千块PA-RISC芯片。太阳可能有几万个。PowerPC被IBM抛弃了,苹果是主要客户,可能会有100万左右。英特尔的销售额高达数亿美元,可以将这笔钱直接投入研发,以制造更快、更强大的芯片。没有人能与之竞争。苹果和亚马逊拥有数十亿部iPhone和数十亿台AWS服务器,它们有足够的规模将所需的巨额资金投入到定制芯片的研发中。因此,在20年来定制RISC让位于英特尔的i86 CISC芯片之后,我们现在再次看到定制硅和RISC的增长。我想知道微内核是否会卷土重来。
你忘了全能的DEC Alpha!但是你的故事有点不正确。这些CPU确实比英特尔销售的任何产品都要快。但他们的死亡还有其他原因:*IBM电力线从未消失。*斯帕克死于甲骨文之手。*惠普被英特尔愚弄了,当PA RISC加入到安腾的研发中时,惠普杀死了他们。*当DEC被康柏(Compaq)收购时,阿尔法去世了,并陷入了与惠普相同的谎言。*不记得MIPS和他们的CPU系列发生了什么,就像在所有SGI上使用的那样。后来安腾被证明是垃圾,在他们创建AMD64扩展时被AMD杀死了。