英特尔的企业处理器平台在最近几代人中一直处于紧张状态,这已不是什么秘密。与竞争对手相比,英特尔正在追逐其多芯片战略,同时依赖一个尚未提供市场上最好的制造平台。也就是说,英特尔在十二月援引其最新的Xeon产品的发货量比AMD在2021个月内发货的多,并且该公司将于2022年底推出下一代蓝宝石RIVES Xeon可扩展平台。除了Sapphire Rapids之外,这里和那里都有轻微的泄漏,但今天英特尔正在揭开这一路线图的盖子。
目前市场上有英特尔的Ice Lake第三代Xeon可扩展平台,该平台基于英特尔的10nm进程节点,拥有多达40个Sunny Cove内核。模具很大,大约660平方毫米,在我们的基准测试中,我们看到与第二代Xeon产品相比,性能有了相当大的提升。考虑到市场竞争,对Ice Lake Xeon的反应喜忧参半,但英特尔通过利用更完整的平台,再加上FPGA、内存、存储、网络和其独特的加速器产品,取得了进步。数据中心的收入取决于您所关注的季度,根据客户消化其当前处理器库存的方式(如首席执行官帕特·盖尔辛格所述)而有所上升或下降。
话虽如此,英特尔已投入大量精力讨论其第四代至强可扩展平台Sapphire Rapids。例如,我们已经知道它将使用>;1600毫米2的硅芯片,用于最高核数的解决方案,四块瓷砖与英特尔的嵌入式桥接技术连接。该芯片将有八个64位DDR5内存通道,支持PCIe 5.0,以及大多数CXL 1.1规范。新的矩阵扩展也开始发挥作用,以及数据流加速器、快速辅助技术,所有这些都建立在Alder Lake桌面平台目前最新的P-core设计之上,尽管针对数据中心使用进行了优化(这通常意味着支持AVX512和更大的缓存)。我们已经知道,Sapphire Rapids版本将配备HBM内存,这些芯片的第一个客户将是阿贡国家实验室的极光超级计算机,以及新的Ponte Vecchio高性能计算加速器。
Sapphire Rapids的推出比几年前最初设想的要晚得多,但我们预计在2022年将看到基于Intel 7 process node技术的硬件广泛可用。
在Sapphire Rapids之外,英特尔终于向公众展示了路线图上即将出现的内容。继Sapphire Rapids之后,我们将在2023年推出平台兼容的Emerald Rapids Xeon可扩展产品,该产品也基于Intel 7构建。根据命名惯例,翡翠滩可能是第五代。
Emerald Rapids(EMR)和其他一些平台更新一样,预计将从Sapphire Rapids设计中获得低挂果实,以提高性能,以及制造业的更新。在平台兼容性方面,这意味着祖母绿在PCIe通道、CPU到CPU连接、DRAM、CXL和其他IO功能方面将获得相同的支持。我们可能也会看到更新的加速器。然而,硅到底会是什么样子仍然是个未知数。由于我们在英特尔的平铺产品组合中仍然是新手,它很有可能类似于Sapphire Rapids,但它同样可能是新的东西,比如英特尔为下一代计划的东西。
在翡翠滩之后,英特尔的路线图将走上一条新的高速公路。我们将看到英特尔在多个层面上的战略多样化。
从顶部开始的是Granite Rapids(GNR),它完全由英特尔的性能内核构建,位于英特尔3进程节点上,将于2024年推出。此前,Granite Rapids作为Intel 4节点产品已被列入路线图,然而,Intel已向我们声明,该技术的进步以及它将在何处发挥作用的时间表,使得在Intel 3节点上安装Granite变得更好。英特尔3是继英特尔4之后的英特尔第二代EUV节点,我们预计两者的设计规则非常相似,因此我们认为两者之间并没有太大的跳跃。
Granite Rapids将像以前一样是一个瓷砖建筑,但它也将在其瓷砖中采用分块策略:它将有单独的IO瓷砖和单独的核心瓷砖,而不是像Sapphire Rapids那样的统一设计。英特尔尚未透露它们将如何连接,但这里的想法是,IO磁贴可以包含所有内存通道、PCIe通道和其他功能,而核心磁贴可以完全专注于性能。是的,这听起来像是英特尔竞争对手今天正在做的事情,但最终这是正确的。
Granite Rapids将与Intel的新产品线共享一个平台,该产品线以同样位于Intel 3上的Sierra Forest(SRF)为起点。这条新的产品线将由数据中心优化的电子内核构建,我们熟悉英特尔目前的Alder Lake消费者产品组合。Sierra Forest的E-core将比我们今天的Gracemont E-core更具未来性,但这里的想法是提供一种更注重核心密度而非直接核心性能的产品。这使得它们能够在较低的电压下运行并并行化,前提是内存带宽和互连可以保持不变。
Sierra Forest将使用与Granite Rapids相同的IO模具。两者将共享一个平台——我们假设在本例中,这意味着它们将是插座兼容的——因此我们希望看到两者都有相同的DDR和PCIe配置。如果英特尔的编号方案继续下去,GNR和SRF将是Xeon可扩展的第6代产品。英特尔在我们的简报中向我们表示,目前由Ice Lake Xeon products提供的产品组合将根据客户要求,由GNR和SRF Xeon组合覆盖和扩展。GNR和SRF预计在发布时将在全球全面可用。
专注于堆芯密度的E-core Sierra Forest最终将与AMD的同类产品进行比较,Zen4c将被称为Bergamo——当SRF上市时,AMD可能会拥有Zen5的同类产品。
我问英特尔,在一个统一平台上迁移到GNR+SRF是否意味着下一代将是一个独特的平台,还是将保留客户喜欢的两代保留。有人告诉我,跨代维护平台兼容性是理想的,尽管这些都是计划好的,这取决于时间和需要集成新技术的地方。PCIe 6.0最早的行业估计(CPU之外)是在2026年,而DDR6更像是2029年,因此除非有更多的内存通道可添加,否则我们很可能会看到第6代和第7代Xeon之间的奇偶校验。
我向英特尔提出的另一个问题是关于混合CPU设计的——如果英特尔现在打算生产P-core和E-core芯片,是什么阻止了这两种产品的结合?英特尔表示,由于不同客户的需求不同,他们的客户更喜欢该市场的单核设计。如果一个客户更喜欢P-Core上的80/20分割,而不是E-Core,那么另一个客户更喜欢20/80分割。为每一个不同的比率提供一系列产品是没有意义的,已经在调查这一点的客户发现,软件在同质化的安排下工作得更好,而不是在系统级别而不是套接字级别进行拆分。所以我们不太可能很快看到混合Xeon。(伊恩:这是件好事。)
我确实询问了统一IO芯片的情况——为相同的仅P核和仅E核Xeon提供相同数量的内存通道和I/O通道可能对这两种情况都不是最佳选择。英特尔在这方面并没有一个好的答案,除了将它们都构建到同一个平台帮助客户在两个CPU之间协同提高不可回收的开发成本,而不管他们使用的是哪一个。当时我没有问,但我们可以看到更多类似Xeon-D的场景,这些场景具有不同的IO配置,适用于较小的部署,但我们现在谈论的是距离现在2-3年以上的产品。
对于Granite Rapids和Sierra Forest,英特尔已经在与关键的“定义客户”合作,进行微体系结构和平台开发、测试和部署。更多细节将要到来,尤其是今年和明年,我们将穿越蓝宝石和翡翠急流。
发表评论伊恩:这是件好事。100%同意,伊恩。DC不喜欢这种混搭的胡说八道,尤其是如果我们看看VMWare及其许可证系统,再加上VM和容器如何与精简指令集上的虚拟机监控程序一起工作,就会觉得一团糟。此外,调度器必须以如此高的规模运行,这将是巨大的资金浪费。英特尔之所以要在主流市场上这么做,是因为他们的IPC目标和SMT性能目标与AMD相比,后者在SMT领域遥遥领先。此外,整个LGA1700 CPU都得到了高密度的热量,远远超过了RKL,因为RKL太热了。因此,他们不得不削减P核,使其时钟频率达到5GHz,并获得最高的SMT性能。现在他们知道E核心将使他们获得所需的性能,他们现在用猛禽湖将他们分割,在E端有更多的核心,以获得SMT与即将推出的怪物禅4的竞争力。至于Xeon,他们不需要在如此高的频率上时钟,加上SMT的性能已经存在,这是由于多socket系统和其他铃铛和哨声。最后,在AMD vs Intel方面,粗略猜测,当他们的E-Core Xeon问世时,看起来Intel将与AMD更具竞争力。此外,AMD和英特尔都采取了这一举措,因为他们想阻止没有SMT技术但内核密度高的ARM服务器处理器。很高兴知道一些路线图。我只想看到X299的真正继承者。AMD可悲地可怕地裁减了ThreadRipper,第1代获得了2个CPU刷新,但第3代被故意裁减,以便在sTRX插槽上获得更多现金。现在没有基于Zen 3的Threadripper,也没有该死的3DV增强Threadripper(最重要的是他们不喜欢AM4上的3DV,因为Zen 4需要强大,新芯片组/插槽AM5需要更多销售)。回复
Threadripper Pro正在与自己竞争。我知道——我';我已经破门而入9个月了。TR Pro在HEDT的性能和效率方面的内容创建没有限制。青山sWRX8为';Zen2';-未来的变种将是';流口水的门环';参加比赛。无意冒犯,但奇奇拉仍在两脚开枪。每个人都知道';英特尔7和39;是10nm++';强化超细粉和#39;不管市场营销和';品牌化';回复
是的,但大多数人都没有';我不知道台积电N7经常被称为";7nm和#34;也是品牌。回复
没有新的或增强的threadripper的唯一原因是因为OEM,他们不想为这些工作站生产线投资,而是更愿意使用";财政资助的英特尔公司";Xeon WS系列。。。对于OEM和用户来说,轻松赚钱是他们别无选择。。。它被称为滥用权力,这是英特尔惯用的东西。因此,threadripper市场仍然是一个利基市场,这对AMD来说很困难,因为他们有太多EPYC交付请求。回复
在过去四年里,螺纹裂土器Duploxx的实际销量接近Epyc;分别为13676597个单位和14269999个单位。利基,嗯,E5 16xx产品系列的范围是2.5米到5米,这就是TR所取代的。E5/Scalable 2P workstation单独的组件,无论是否集成到工作站中,我的数据仅涵盖17倍TR卷的组件。TR世代以来一直是AMD的盈利利基。mb回复
"伊恩:这是件好事" 数据中心客户确实想要他们的E核和P核。因此,他们将购买(取决于他们的需求)10万个仅含E核的处理器和10万个含P核的处理器。34岁;让';s在同一个芯片中有一些E核和一些P核#34;不在他们的雷达上。回复
他没有';不要说数据中心客户没有';我不想要E核和P核。他只说它不是';我不想像消费者空间一样使用同一个CPU插槽。回复
我';我猜。由不太全球化的企业拥有和运营的服务器可以使用E-core块在需要时保持灯亮,但不是';我不是很忙,但云服务提供商会想把这些未使用的周期卖给其他人。回复
我相当确定,在生产经济评估中,TR 5K存在多达100万台,惠普和联想直接向客户销售工作站,在二级市场出现之前不会被看到。这使得AMD和OEM获得了利润';s的口袋,而不是渠道,他们可能会夸大自己的TR5K保证金。在这两种情况下,AMD都避免了在Zen 3 run end production和#39;定价过高';同时也降低了渠道购买其他产品的财务能力,包括AMD。安培3090ti处于相同的位置,直接销售。主销卡是一种伪装成消费者的商业产品,需要安装冷却基础设施,才能将该子系统集成到集群中。Think white space limited high density Communications位于高频金融交易24kW机架上,客户了解并拥有实施500W dGPU的冷却基础设施。同样在这种情况下,英伟达与合同IDM一起获得利润,并通过将信用卡排除在渠道之外,不受渠道膨胀定价的影响,防止3090ti的任何数量被高估,并且当它们被出售时,渠道#39;公司夸大的利润将用于购买除英伟达以外的产品。AMD和英伟达都在控制产品销售利润的回报。通过将TR5K和3090i排除在渠道之外,这些产品所获得的利润将返还给他们,而不是英特尔,后者主要受益于渠道安培,利润膨胀将为英特尔的新采购提供一般资金,而不是英伟达的新采购。Mike Bruzzone,营地营销回复