英特尔最终为其AVX-512指令集辩护,反对那些甚至希望它“痛苦地死去”的批评者。
英特尔首席架构师Raja Koduri表示,社区喜欢它,因为它能带来巨大的性能提升,英特尔有义务在其产品组合中提供它。
“AVX-512是一个很棒的功能。我们的HPC社区,AI社区,非常喜欢它。“在8月11日的英特尔架构日上,Koduri在回答PCWorld网站关于AVX-512乱七八糟的问题时说,”我们在数据中心方面的客户真的、真的、真的很喜欢它。“。
Koduri说,英特尔仅仅通过利用扩展功能,就能帮助客户在“我们良好的旧CPU插槽”上实现285倍的性能提升。
Linux的创造者Linus Torvalds不喜欢AVX-512。在Real World Technologies的一篇论坛帖子中(他经常在那里插话),托瓦尔兹坦率地谈到了英特尔至强CPU及其第10代“冰湖”笔记本电脑CPU(如酷睿i7-1065G7)中包含的指令集。
托瓦尔兹写道:“我希望AVX-512死得很痛苦,希望英特尔开始修复真正的问题,而不是试图创建神奇的指令,然后创建看起来不错的基准。”“我希望英特尔回到最基本的问题上来:让他们的程序再次运行,把更多的精力放在不是HPC或其他一些毫无意义的特殊情况下的常规代码上。”
托瓦尔兹说,让他恼火的是AVX-512在台式机上的性能打击。例如,英特尔最初的Skylake-X系列在任何接触AVX-512的过程中都将被迫降低CPU时钟速度。
“我希望通过常规整数代码达到我的功率极限,而不是使用某种夺走最高频率的AVX-512功率病毒(因为人们最终会将其用于memcpy!)。并带走核心(因为那些无用的垃圾单元占用空间),“托瓦尔兹写道。
托瓦尔兹也不是唯一踢中AVX-512小腿的人。前英特尔工程师弗朗索瓦·皮德诺尔(Francois Piednoel)也表示,这一特殊指令根本不属于笔记本电脑,因为功率和芯片空间面积的权衡是不值得的。
“我们的CPU核心是我们皇冠上的明珠,”Koduri说。因此,当我们制作CPU核心并向其添加指令时,从历史上看,x86和我们的指令集扩展的强大之处在于我们让它们随处可用。正因为如此,当我们有一个像Sunny Cove这样的IP,它既出现在冰湖服务器这样的服务器上,也出现在冰湖客户端这样的客户端上,你就会得到指令集的共性。“。
科杜里也承认托瓦尔德的热度有一定的正确性。莱纳斯从一个角度批评说,‘嘿,还有没有客户端应用程序利用了这个向量位?’可能是有效的,“他说。Koduri进一步解释说,英特尔必须保持从服务器到笔记本电脑的硬件和软件合同,因为这就是生态系统的魔力所在。
“(那)x86生态系统的伟大之处在于,你可以为你的笔记本电脑写一款软件,它也可以在云上运行,”Kodori说。“这就是x86生态系统的力量所在。”
科杜里的评论呼应了英特尔机器学习性能总经理D·魏丽的类似评论,他表示,用于人工智能和深度学习的CPU是有意义的。
“为什么选择CPU?中央处理器无处不在,而且是通用的,李说。“当你有一个数据中心时,你会有很多至强。当你有一台笔记本电脑时,你就有了一个CPU。如果你能让CPU为AI工作,那么每个人都能从中受益。“。
不,讨厌AVX-512和你想要的特殊说明,英特尔不会改变方向。Koduri表示,它将继续依赖AVX-512以及其他指示。
“我们理解莱纳斯的担忧,我们理解第一代AVX-512的一些问题,这些问题对频率等产生了影响,”他说,“我们正在让每一代人都做得更好。”
事实上,注重性能的软件博客作者特拉维斯·唐斯说,他对酷睿i5-1035G4的测试表明,AVX-512似乎并没有对笔记本电脑施加太多惩罚。Down测试发现,在AVX-512下使用一个活动内核时,时钟速度仅下降了100 MHz。
唐斯总结道,至少,这意味着我们需要调整我们对AVX-512指令频率相关成本的心理模型。在这款冰湖芯片上,我们可以说AVX-512会导致微不足道或零的基于许可证的降频,而不是通常会导致显著的降频。我预计其他冰湖客户芯片也会出现这种情况。他的发现还有更多微妙之处,但值得一读。
注:当您在点击我们文章中的链接后购买商品时,我们可能会赚取少量佣金。有关更多详细信息,请阅读我们的代销商链接政策。