苹果M1 –速度极快的x86竞争对手

2020-11-23 18:23:24

现在,围绕Apple的ARM驱动的设备有很多可以理解的兴奋。而且,对于苹果迷和好奇的苹果,我们对这些设备及其生态系统进行了传统的评论。这不是其中的一项评论-尽管某些新Mac的评论迫在眉睫。相反,与更传统的x86系统相比,我们将更仔细地研究新M1的原始性能。 M1的CPU是5nm八核大/小设计,具有四个性能内核和四个效率内核。这个想法是,需要低延迟的以用户为中心的前台任务将在性能核心上运行,但是对延迟敏感度较低的后台任务可以在四个功率较低但功耗较低的效率核心上运行得较慢而较低。

除了八个CPU内核,Mac mini中的M1版本还具有八个GPU内核,总共有128个执行单元。尽管要在这种新架构上获得准确的“苹果对非苹果”基准非常困难,但我有信心地说,这确实是世界领先的设计-您可以获得更快的原始CPU性能,但只有在功耗不变的情况下-无对象台式机或服务器CPU。同样,您可以使用高端Nvidia或Radeon台式机卡击败M1的GPU,但仅在功耗,物理尺寸和热量方面存在巨大差异。

与传统的Windows,Linux和macOS计算机基础的x86-64相比,ARM体系结构通常具有显着的电源效率优势。这种能效优势使ARM赢得了手机和平板电脑等超移动设备领域的早期和压倒性的胜利,在毫不费力的情况下,毫瓦级的能耗要比原始性能节省得多。从那以后,ARM开始侵占数据中心,并且出于同样的原因-即使单个ARM处理器的性能通常不及它们的x86同类产品,但它们却完成了相同的工作量,并且所需的功耗和散热费用更低。

台式机和传统笔记本电脑是x86-64体系结构的最后堡垒。在这些外形尺寸中,性能以及运行零损害的运行熟悉的操作系统和软件堆栈的能力已成为最重要的标准。但是ARM也在台式机领域也来了,尽管速度较慢,而且大多数情况下是在低端市场,正如我们在Pinebook Pro等设备中所看到的那样。

苹果的新型M1片上系统(SoC)绝对不是那些低性能,低成本的产品之一。 M1从一开始就被设计为功能强大且相对于传统PC架构而言毫不妥协的竞争产品。

试图在M1及其x86-64竞争对手之间进行直接的性能比较非常令人沮丧-在我们的设备评测中,我们通常非常依赖通用的综合基准套件,该套件可以针对平台运行各种测试,并且一个简单的数字分数。不幸的是,并非所有基准套件都在macOS上运行,很少有套件在Apple Silicon上运行,并且几乎没有在Apple Silicon上的macOS 11上运行。

Geekbench 5.3.0是该规则的一个很好的例外,其全新版本已在Apple Silicon macOS和App Store中本地运行。当然,Geekbench并不是全部。它可以消除CPU中的大多数差异,而偶尔且不可预测地放大其他差异。而且由于Metal是Apple的设备和软件进行了优化的API,因此我们通常根本不使用基于OpenCL的GPU测试。

但是由于我们正在少数平台上寻找全新的架构,因此在其零售版发布之前,我们在闪亮的,预包装的基准套件方面非常有限。在Geekbench有限的世界中,很明显M1是赢家,无论我们是在研究多线程CPU,单线程CPU还是OpenCL GPU测试,它都击败了所有竞争对手。

坦白说,我对Geekbench不满意。为了确保得出一个简单的结论(M1 SoC是一个燃烧室,能够与任何和所有移动竞争对手一较高下),我需要进行一些扩展。

浏览器内基准测试是一项可以在根本不同的架构之间进行良好转换的测试,因为它可以衡量相对真实的任务-复杂的操作在Web浏览器中的呈现程度。尽管诸如Jetstream 2.0和Speedometer之类的基准测试仍是综合性的,但它们可以模拟每个用户期望工作的实际操作,无论如何完成这些细节。

由于Mac mini的M1处理器与最新的iPad和iPhone中的A12Z和A14 Bionic共享其ARM架构-并且,苹果明智地在App Store中提供了这些设备中的大多数应用程序-这开辟了另一条比较的途径。 3DMark的Slingshot Extreme Unlimited不允许我在x86-64 PC上测试M1,但可以让我评估M1在最快的移动硬件方面的实力。

通过检查浏览器基准,M1驱动的mini通过了出色的测试。当在Apple Silicon上使用Safari时,mini绝对让Ryzen 4700U驱动的Acer Swift 3脱颖而出-即使通过Rosetta运行x86-64 Google Chrome时,它也表现出色。

我告诫读者不要尝试在这些测试结果和实际浏览体验之间进行直接比较-在实践中,它们都是非常快的机器,它们在Web和其他任何地方都感觉流畅。更为重要的一点是,mini及其M1 ARM体系结构当然并不慢。

通过使用3DMark的Slingshot Extreme移动游戏测试套件将其与备受赞誉的iPad Pro 2020进行比较,我们可以进一步了解M1的实力。如果您想在mini上玩自己喜欢的手机游戏,那么只要应用能够很好地翻译,那么它显然应该是一流的体验—我们看到从iPhone 12 Pro到华硕的旗舰Android游戏手机几乎完美的阶梯式发展(是的,就是这样),从那里到iPad Pro 2020,再到牢固地堆在顶部的M1驱动的mini。

美中不足的是迷你游戏机(或更轻巧的同胞游戏,M1驱动的Macbook Air和Macbook Pro)上的移动游戏,这是因为Big Sur的App Store中尚未提供所有iOS应用程序。苹果使用自动系统筛选出不合适的应用程序,并通过人工策划确认其中的某些过滤器。此外,开发人员可以选择不包括其应用程序。令我特别失望的是,Wild Life(3DMark的最新基准应用程序)丢失了。该应用程序确实允许PC与移动设备之间的跨平台比较,并且确实非常有用。

让我们先解决一下—不,数据压缩并不是真正的成为所有CPU性能基准。话虽如此,这是一个非常直接的现实世界任务,在CPU上造成瓶颈,每个用户都相当频繁地经历它。为了测试数据压缩速度,我做了以下工作:

下载pigz的源代码,并在ARM mini模式下的Mac mini上进行编译

如果在没有其他参数的情况下运行,pigz会为其在线找到的每个CPU线程产生一个压缩线程-这意味着4big / 4little M1和八核/八线程Ryzen 7 4700u都有八个进程。 macOS应用程序活动监视器确认CPU利用率超过700%,这证实了M1的四个效率核心确实在发挥作用。

尽管此测试产生的结果与Geekbench截然不同,但它确实确认M1是世界领先的处理器设计。即使与拥有八个完整高性能内核的AMD Ryzen 7 4700u堆叠在一起,M1仍取得了极其狭窄的胜利。这次胜利完全在误差范围之内...但是这也表明,即使在4700U的最佳日子里,在这种强大的配置下也无法击败苹果的ARM处理器。

我的台式机工作站具有八核,16线程的Ryzen 7 3700X,可以无限制地轻松击败M1和4700u,但这是通过充分利用功耗差异来实现的。 Ryzen 7 3700X中的TDP为65W,而在这样的工作负载下以最佳性能长时间运行时,其实际消耗量明显更高。

了解了整个CPU在大规模并行工作负载上的强大功能之后,我想知道的第二件事是四个性能内核本身的运行速度有多快。再次运行测试,这次使用-p4参数将Pigz限制为四个进程,M1排在首位-不仅在Ryzen 7 4700u的首位,还是所有一切的首位。它击败了我的Ryzen 7 3700X台式工作站,甚至击败了我的露天测试台上的Ryzen 9 5950X。

最后,我运行pigz -p1以获得关于M1单核能力的第二种意见。我真的没想到这里会有什么惊喜,也没得到任何惊喜-M1超过了我手头的每个系统,包括Ryzen 9 5950X测试台。

不幸的是,我还没有Intel的i7-1185G7 Tiger Lake系统之一可以进行新的测试,但是我怀疑这很重要— i7-1185G7应该与Ryzen 9 5950X并驾齐驱,以实现单线程性能, 5950X在单线程上比M1稍慢。

如果Apple的M1不是全球最快的单线程和四线程消费者可用处理器,那么它肯定不会错过太多。