疯狂渲染的核心:AMD Threadripper Pro 3995WX评估

2021-02-09 23:09:33

了解您的市场是产品计划,营销和分销的关键基础。创造没有市场的产品是没有意义的,或者发现您有令人惊奇的东西,但是将其提供给错误类型的客户是没有意义的。当AMD开始提供高核数的Threadripper处理器时,图形设计业务便是吸引了尽可能多市场的市场–视觉效果公司和专注于渲染的公司都喜欢核数,内存支持,所有PCIe通道,和价格。但是,如果能带来更多性能,那就是对更高性能的渴望。输入Threadripper Pro。

从外部看,许多行业的发烧友可能会认为使用CPU可能是过时的–问题被问到为什么该行业没有完全转向使用GPU加速器?机器学习是其中一项重要的工作-尽管已推动使用专用的机器学习硬件,并且许多大型企业都在GPU上进行机器学习,但当今大多数机器学习仍在CPU上进行。图形和视觉效果也是如此。

其背后的原因通常归结为所使用的软件包和负责编程的人员。

为CPU开发软件很容易,因为这是大多数人接受过的培训。完善的CPU优化软件包,甚至对于即将发布的专家指导,也可以在模拟环境中开发。 CPU旨在处理几乎所有抛出的错误,甚至是超级糟糕的代码。

相比之下,GPU计算难度更大。它并没有以前那么困难,因为有各种各样的库可以进行GPU编译,而无需太多了解如何为GPU编程,但是困难在于架构工作量以利用什么GPU必须提供。 GPU是一个庞大的引擎,可同时对数百个并行线程执行相同的操作-它具有非常小的缓存,并且对GPU内存的访问时间很长,因此通过同时运行更多线程来隐藏延迟。 。如果软件的计算部分不适合这种工作负载(例如在结构上更加线性),那么花6个月的时间重新开发GPU就是浪费的工作。甚至即使数学运算在GPU上效果更好,尝试为GPU重建已有20年历史(或更旧)的代码库仍然需要一组专家的大量努力。

自从2000年代末以来,GPU计算就开始突飞猛进。但是事实仍然是,仍有许多行业混合使用CPU / GPU吞吐量。其中包括机器学习,石油和天然气,金融,医学,而我们今天关注的是视觉效果。

视觉效果设计和渲染工作负载是专用软件平台和插件的复杂组合。 Cinema4D,Blender,Maya,Autodesk等软件均依赖GPU展示部分渲染的场景,以便这些艺术家实时工作,同时还依赖于强大的单核性能,但最终渲染的计算量将取决于该特定产品使用了哪些插件。有些插件是GPU加速的,例如Blender Cycles,而转移到更多GPU加速的工作量正在花费时间–光线跟踪加速设计是吸引GPU广泛关注的领域。

始终存在着哪种方法产生最佳图像的问题–如果GPU会增加额外的噪点或降低质量,那么使用GPU来加快渲染时间毫无意义。与在GPU上快速嘈杂的电影相比,电影制片厂更有可能优先考虑在CPU上缓慢的高质量渲染。许多工作室会直截了当地说CPU上的质量更好,而有些工作室则认为,在CPU上使用高精度64位数字非常容易,而32位GPU则很容易。可能会降低真正12位HDR图像所需的36位质量(显然比这复杂得多–大多数GPU都采用某种形式的64位,但最好的也是最昂贵的,企业级/仅限HPC)。

我要说的是,VFX工作室仍然更喜欢CPU计算,而且效果越好。当AMD推出其新的基于Zen的处理器时,特别是32和64核计数型号,这些处理器立即被指定为这些VFX工作室使用的Xeon的潜在替代品。 AMD的部件优先考虑FP计算,这是VFX设计中的关键要素,每个插槽具有双核的情况也是赢家,同时每个内核具有大量的缓存。后一部分意味着,即使最初的高核数部分具有不统一的内存体系结构,也没有像其他一些计算过程那样有太大的问题。

据我们了解,许多VFX公司专注于AMD的Threadripper平台,而不是相应的EPYC。当这两个部件首次投放市场时,VFX工作室很容易在Threadripper上构建桌面式工作站,而EPYC则更多地用于服务器机架安装,而工作站则不多。滚动到Threadripper 3000和EPYC 7002,现在有64个内核,64个PCIe 4.0通道,并且有很多选择。 VFX工作室仍然选择Threadripper,主要是因为它提供了280 W的更高功率,而这种功率很容易由专门从事高性能台式系统的Armari等系统集成商提供。他们还要求AMD提供更多信息。

AMD现在已经推出了Threadripper Pro平台,可以满足其中的一些要求。虽然VFX始终专注于核心计算,但是TR Pro现在提供了两倍的PCIe通道,两倍的内存带宽,最多支持2TB内存以及Pro级管理员支持。这些PCIe通道可以扩展到本地存储(在VFX中始终很重要)以及大型RAMDisk,并且通过DASH提供的管理员支持有助于保持公司系统的正确管理。 AMD的Memory Guard也属于Pro系列产品,旨在实现全内存加密。

除VFX之外,AMD还引用了TR Pro的世界领先计算技术,该产品用于Creo的产品工程,具有KeyShot的3D可视化,具有Autodesk Revit的建筑模型设计以及诸如石油和天然气数据集分析之类的数据科学,其中数据集不断发展。数百GB,并需要大量的计算支持。

从这些新处理器提供的好处来看,很明显,它们比“增强型” Threadrippers更像是工作站风格的EPYC部件。细分:

为了使这些新零件从EPYC开始,AMD要做的就是将TDP提高到280 W,并削减对DRAM的支持。如果我们从Threadripper的基础开始,会有3-4个实质性的变化。那么,为什么将其称为Threadripper Pro,而不是Workstation EPYC?

我们再次回到视觉特效工作室。已经了解了Threadripper的品牌和思维方式后,将这些零件保留为Threadripper有助于平滑过渡-从我们所得知的情况来看,该垂直行业已经说过,他们更喜欢Threadripper而不是EPYC,因此保持命名的一致性意味着:没有真正的再教育。

另一个因素是EPYC处理器产品线有些断裂:有标准版本,高性能H型,高频F型,然后有B,V等一系列针对特定客户的定制设计。通过将这一新产品线保留为Threadripper Pro,它可以将所有产品保持在同一伞下。

AMD于去年年中宣布了这些处理器,同时联想Lenovo Thinkstation P620也作为发布平台。根据我的经验,Thinkstation系列产品的设计非常出色,我们今天正在P620中测试3995WX。

与联想宣布TR Pro时,我们不确定是否有其他OEM可以使用Threadripper。当我们在那年早些时候向OEM询问此事时,甚至在我们还不知道TR Pro是否是真品之前,他们就表示AMD甚至没有在其路线图上标记该平台,这是我们当时报告的。从那以后,我们了解到联想拥有六个月的独家使用权,并且在宣布该信息后仅将其信息提供给其他供应商(华硕,技嘉,超微)。

为此,AMD从那以后宣布Threadripper Pro即将零售,既可以供其他OEM设计系统,也可以供最终用户自行构建。尽管使用与其他Threadripper和EPYC处理器相同的LGA4094插槽,TR Pro仍将锁定在WRX80主板上。目前,我们已经了解了三款产品,例如Supermicro和GIGABYTE型号,此外我们还拥有ASUS Pro WS WRX80E-SAGE SE Wi-Fi型号,虽然我们无法对其进行测试,但可以进行简短的动手操作。

在上面列出的四个处理器中,前三个正在销售中。值得注意的是,只有64核带有256 MB的L3缓存,而32核带有128 MB的L3缓存。 AMD坚持认为,这些芯片设计仅使用绝对必要数量的芯片组,从而使每个内核的L3高速缓存以及每个芯片的8内核保持一致(EPYC产品线有所不同)。

第四个处理器(12核)似乎是针对预构建系统的OEM专用处理器。

这些Threadripper Pro产品旨在与两个细分市场竞争:首先是AMD本身,向正在使用基于第一代Zen硬件构建的高端专业系统的任何人展示具有很多性能。第二个是针对英特尔工作站客户的,要么使用单插槽Xeon W(最高可达28核),要么使用成本更高或使用更多功率的双插槽Xeon系统,因为它是双插槽,但具有非均匀内存架构。

在此测试中,我们几乎拥有所有这些处理器(我们没有7702P,但是确实有7742),实际上,如果您可以选择3995WX,则这些是唯一应考虑的处理器:

英特尔拥有28个核心,这是无法避免的。从技术上讲,英特尔拥有多达56个内核的AP处理器产品线,但是这些产品是用于专业系统的,我们还没有实际发送过用于测试的产品。那些价格也是每个CPU 2万美元以上,并且是同一系统中的两个CPU用螺栓固定在一个封装下。

尽管有2P版本,但AMD比较点是最好的Threadripper选项和最好的可用EPYC处理器。最好的比较是7702P,单插槽版本和更具价格竞争力的产品,但是我们尚未对此进行测试,而是拥有了AMD的EPYC 7742,它是双插槽版本,但稍高一些性能。

我们必须感谢以下公司为我们的多个测试台提供硬件。该硬件中的某些不在此测试台中,而是在其他测试中使用。

对我们当前的CPU基准套件的详细信息感兴趣的用户可以参考我们的#CPUOverload文章,其中涵盖了基准自动化的主题以及套件运行的内容以及原因。我们还对基准数据进行了比典型审阅中显示的数据多得多的数据,您可以在基准数据库中看到所有这些数据。我们称其为“基准”,网站顶部还有一个链接,以备日后进行处理器比较时使用。

发表评论TLDR:除非您绝对需要3990X不包含的3995WX功能,否则3990X是一个更好的选择:几乎相同的性能,便宜1,500美元。回复