当AMD宣布其新的Zen 3核心是一次彻底的重新设计,并提供完全的性能领先时,我们不得不要求他们证实这是否真的是他们所说的。尽管AMD的规模还不到英特尔的10%,而且在2015年作为一家公司已经接近倒闭,但AMD在那个时间框架内对其下一代Zen微架构和Ryzen设计的押注现在正在结出硕果。针对台式机市场,Zen 3和新的Ryzen 5000处理器实现了这些目标:不仅性能功耗比和性能价格比处于领先地位,而且在每个细分市场都处于绝对的性能领先地位。我们已经研究了新的微体系结构,并测试了新的处理器。AMD是新的王者,我们有数据证明这一点。
新的Ryzen 5000处理器是Ryzen 3000系列的替代产品。今天,任何拥有AMD X570或B550主板,拥有最新BIOS(AGESA 1081或更高版本)的人,都应该能够毫不费力地购买和使用其中一个新处理器。任何拥有X470/B450主板的用户都必须等到2021年第一季度这些主板进行更新。
正如我们之前所说的,AMD今天将推出四款处理器进行零售,从六核到十六核不等。
根据JEDEC标准,所有处理器都具有对DDR4-3200内存的本机支持,尽管AMD建议使用稍微快一点的内存以获得最佳性能。所有处理器还具有20条PCIe 4.0通道,可用于附加设备。
顶级处理器是Ryzen 9 5950X,有16个内核和32个线程,提供3400 MHz的基频和4900 MHz的Turbo频率-在我们的零售处理器上,我们实际上检测到了5050 MHz的单核频率,这表明该处理器将在5.0 GHz以上进行涡轮增压,具有足够的散热余量和冷却!
该处理器通过两个八核芯片(下面将详细介绍)启用,每个芯片具有32MB的L3高速缓存(总计64MB)。Ryzen 9 5950X的额定TDP与Ryzen 9 3950X相同,为105W。根据AMD的插座设计,在支持它的主板上,峰值功率将为~142W。
对于那些没有阅读其余评论的人来说,Ryzen 9 5950X的简短结论是,即使在799美元的建议零售价下,它也能使整个消费级产品的表现达到一个新的水平。单线程频率高得离谱,当与具有更高IPC的新内核设计相结合时,会将单核受限的工作负载推到英特尔最好的Tiger Lake处理器之上。在多线程工作负载方面,我们全面记录了消费类处理器。
与英特尔最好的消费级处理器相抗衡的是Ryzen 9 5900X,它有12个内核和24个线程,基频为3700 MHz,涡轮频率为4800 MHz(观察到4950 MHz)。该处理器通过两个六核芯片启用,但所有高速缓存仍以每个芯片32MB的速度启用(总共64MB)。5900X还具有与其在105W时替代的3900X/3900XT相同的TDP。
549美元的价格比它所取代的处理器高出50美元,这意味着额外10%的成本,它将不得不展示它的性能至少可以提高10%。
在上一代AMD展示了一款不到100美元的四核处理器后,花了很大力气才能以449美元的价格提供一款八核处理器--AMD坚持其声称的这款处理器可以大幅提升代际性能的说法。新的AMD Ryzen 7 5800X拥有8个内核和16个线程,将与英特尔的酷睿i7-10700K展开竞争,酷睿i7-10700K也是一个8核/16线程处理器。
Ryzen 7 5800X的基频为3800 MHz,额定Turbo频率为4700 MHz(我们检测到了4825 MHz),并使用了一个8核芯片,总共有32MB的L3缓存。与需要跨CPU通信的双芯片设计相比,单核心芯片有一些小的好处,这在我们的一些CPU非常有限的游戏基准中得到了体现。该处理器还具有105W的TDP(约142W峰值)。
AMD今天发布的最便宜的处理器是Ryzen 5 5600X,但它也是唯一一款配备CPU散热器的处理器。Ryzen 5 5600X有6个内核和12个线程,运行在3700 MHz的基频和4600 MHz的峰值Turbo(测量为4650 MHz),并且是唯一被赋予65W(~88W峰值)的TDP的CPU。
单芯片设计意味着总共32MB的三级高速缓存(从技术上讲,它仍然与Ryzen 9部件的单核访问能力相同),并将与英特尔的六核i5-10600K进行竞争,后者的零售价也与Ryzen 9大致相当。
尽管Ryzen 5 5600X处理器价格最低,技术上也是最慢的,但它的性能让我大吃一惊:与Ryzen 9 5950X类似,在单线程基准测试中,它完全超越了英特尔所能提供的所有处理器--甚至包括泰格湖(Tiger Lake)。
在更高的层面上,新的Ryzen 5000;Vermeer系列似乎与上一代Ryzen 3000《马蒂斯》系列出奇地相似。这实际上是出于设计目的,因为AMD在新处理器中充分利用了他们的芯片设计方法。
为了介绍一些术语,AMD创造了两种类型的芯片。其中一个有主要的加工核心,被称为核心复合模或CCD。这是一款基于台积电7纳米制程的产品。另一种芯片是带有I/O的互连芯片,称为IO芯片或IOD-这一芯片具有PCIe通道、内存控制器、SATA端口、与芯片组的连接,并有助于控制电力传输和安全。在上一代和新一代中,AMD都将其IO中的一个芯片与多达两个8核芯片配对。
这是可能的,因为新的核心小芯片包含用于互连、物理设计和功率限制的相同协议。AMD能够利用上一代平台和代的执行,这样当核心连接相同时,尽管内部结构不同(Zen 3与Zen 2),它们仍然可以以已知和成功的方式组合在一起并执行。
和上一代一样,新的禅宗3芯片设计有8个内核。
通过使新的8核Zen 3芯片保持相同的大小和相同的功率,这显然意味着AMD必须构建一个符合这些限制的内核,同时提供性能和性能效率的提升,以便做出更有说服力的设计。通常,在设计CPU内核时,最容易做的事情就是利用之前的设计,对其某些部分进行升级--也就是工程师们所说的“低垂的果实”,即以最少的努力获得最大的加速。因为CPU核心设计是有最后期限的,所以总会有一些想法永远不会进入最终设计,但这些想法会成为下一代最容易瞄准的目标。这就是我们在Zen 1/Zen+转到Zen 2时看到的。所以很自然,AMD做的最简单的事情也是一样的,但是Zen 3。
然而,AMD并非如此。在对AMD高级员工的采访中,我们了解到AMD有两个独立的CPU核心设计团队,他们的目标是在构建更新的、高性能的核心时相互超越。禅1和禅2是第一核心设计团队的产品,现在禅3是第二设计团队的产品。自然,我们预计禅宗4将成为禅宗3的下一代,“低垂的果实”将得到照顾。
在最近对AMD首席技术官Mark Papermaster的采访中,我们被告知,如果你从10万英尺的高度看核心,你可能很容易误认为Zen 3的核心设计类似于Zen 2。然而,我们被告知,因为这是一个新的团队,核心的每个部分都经过了重新设计,或者至少是更新了。密切关注这一领域的用户会记得,Zen 2中使用的分支预测器在Zen 3之前是不会出现的,这表明即使是核心设计也有可移植性的元素。Zen 2和Zen 3都建立在相同的TSMC N7工艺节点上(相同的PDK,尽管Zen 3拥有来自TMSC的最新良率/一致性制造更新),这也有助于提高设计的可移植性。
AMD已经宣布了一个重大变化,这对大多数对这一领域感兴趣的技术人员来说都是显而易见的:基础核心芯片不是有两个四核复合体,而是一个八核复合体。这使得每个内核能够访问芯片的全部32MB的三级高速缓存,而不是16MB,从而缩短了16到32MB窗口中的内存访问延迟。它还简化了芯片内的核心到核心通信。要做到这一点,需要做一些权衡,但总的来说,这是一场不错的胜利。
事实上,在整个核心地区存在着大量的不同之处。AMD已有所改善:
其中许多内容将在接下来的几页中进行解释和扩展,并在基准测试结果中进行观察。简而言之,这不仅仅是核心的更新--这些都是真正的新核心和新设计,需要在新的纸张上建造。
其中一些特性,比如更宽的缓冲器和更高的带宽,自然伴随着一个问题:与Zen 2相比,AMD是如何保持Zen 3的功率不变的。通常情况下,当内核变宽时,意味着必须一直打开更多的硅,这会影响静态功率,或者如果所有这些都同时使用,那么就会有更高的有功功率。
在接受Mark Papermaster采访时,他指出AMD在物理实现方面的能力是其中的一个关键因素。通过利用他们对台积电7纳米(N7)制程的了解,以及对他们自己工具的更新来充分利用这些设计,AMD能够保持电源中立,尽管进行了所有这些更新和升级。部分原因还来自AMD与TMSC的长期优质合作伙伴关系,能够在平面图、制造和产品之间实现更好的设计技术协同优化(DTCO)。
自第一代Zen推出以来,AMD的CPU营销团队一直非常准确地宣称其性能,甚至时不时地低估其性能。除了在单线程、多线程和游戏方面提升性能领先地位外,AMD还推出了几个逐代改进的指标。
AMD提供的关键指标是IPC从Zen 2升级到Zen 3+19%,或者更确切地说,当两个CPU都在4.0 GHz并使用DDR4-3600内存时,从Ryzen 5 3800XT升级到Ryzen 5 5800X+19%。
事实上,使用我们的行业基准,对于单线程性能,我们观察到每个时钟的CPU性能提高了19%。我们必须在这里向AMD致敬,这是他们第二次或第三次引用我们匹配的IPC数据。
在多线程SPECrate中,考虑到更快的内核也需要更多的主存带宽(这一代没有提供),绝对增益只有10%左右。这意味着存在一些瓶颈,如果更多的内核需要相同的资源,那么更高的IPC将无法帮助解决这些瓶颈。
在实际测试中,在我们的整个套件中,我们看到平均提升了24%。对于显式多线程测试,我们看到的范围从均匀性能到+35%,而对于显式单线程测试,范围从均匀性能到+57%。这归根结底是执行/计算限制的测试在内存限制的工作负载上获得更大的加速。
对于游戏,这个数字在1920x1080游戏中以+5%到+50%的形式给出,在高预设的情况下,将Ryzen 9 5900X与Ryzen 9 3900XT进行比较,这取决于基准。
在CPU受限设置(例如720p或480p最低设置)下的测试中,我们发现Ryzen 9 5950X与Ryzen 9 3950X相比,平均每秒帧数提升44%。根据测试的不同,性能提升的幅度从+10%到+80%不等,切尔诺贝利、Borderland 3、齿轮战术和F1 2019的关键收益。
对于我们更主流的游戏测试,运行在1920x1080,所有的质量设置都是最大的,性能提升平均在+10%左右。这从相同的分数(坦克世界,奇异旅,红色死亡救赎)到+36%(文明6,遥远的哭泣5),横跨了所有的色域。
也许最重要的比较是AMD Ryzen 9 5950X与英特尔酷睿i9-10900K的对比。在我们的CPU受限测试中,AMD在CPU受限的情况下获得了+21%的平均FPS胜利,范围从+2%到+52%。但在我们的1080p最大设置测试中,结果平均并驾齐驱,在-4%到+6%之间波动。(这一结果不包括我们测试中的一个异常情况,因为文明6号显示AMD赢得了+43%的胜利。)。
根据内核数量和定价,新的Ryzen 5000系列处理器与英特尔一些最受欢迎的Comet Lake处理器以及上一代AMD硬件非常接近。
在整个回顾中,我们将参考这些比较,并最终将每个处理器细分为其自己的分析细目。
由于这是我们对禅宗3的深度报道,我们将深入探讨一些细节。在接下来的几页中,我们将回顾一下:
发表评论是的!我只想看到缓存和延迟部分-统一缓存允许6核和12核设置,而不会受到部分CCX的影响!回覆。
至少在火箭湖(Rocket Lake)到来之前,AMD终于有了一台英特尔(Intel)打击机。有真正的竞争将是伟大的计算。不错的评论。回覆
非常令人印象深刻。我认为我的3950X在下一个插座之前很好,但单线提升是非常诱人的。回覆