当您使用支持GeForce RTX 3080的魁梧GPU,再启用几千个内核,拓宽内存接口,将内存容量提高一倍多,增强纹理功能,并为怪兽配备安静、超大尺寸、高性能的冷却器时,会发生什么情况?好吧,我们会告诉你的。你最终会得到GeForce RTX 3090,或NVIDIA首席执行官Jensen Huang在正式揭幕时所称的“BFGPU”。如果您不熟悉那里的Doom BFG参考资料,我们可以让您查找。请放心,BF并不代表最好的朋友。不管你想怎么称呼GeForce RTX 3090,有一件事是肯定的。到目前为止,GeForce RTX 3090是钱能(几乎)买到的最强大的显卡。它目前处于NVIDIA产品堆栈的顶端,据该公司称,它能够实现流畅的8K游戏和无缝处理大量内容创作工作负载,这在一定程度上要归功于其24 GB的板载GDDR6X内存。然而,像GeForce RTX 3090这样的显卡并不适合每个人。尽管它的要价比上一代、总部位于图灵的泰坦RTX低了约1,000美元,但对于大多数用户来说,它仍然遥不可及。而GeForce RTX 3090的性能特点可能只会让它的价值主张对少数发烧友和创造者感兴趣。我们将尽最大努力在前面的页面上更好地解释所有这些内容。现在,让我们看一下规格,看看这只又大又漂亮的野兽。虽然NVIDIA已经将这款卡命名为GeForce RTX 3090,但它基本上是上一代泰坦RTX的替代品。因此,它不仅仅是一款专注于游戏的GPU。根据NVIDIA的说法,对各种泰坦的需求高于预期,因此对于这一代产品,除了直接销售它们之外,NVIDIA还与董事会合作伙伴合作,扩大供应范围,因此他们还将提供GeForce RTX 3090系列卡。在我们深入研究速度和提要之前,我们需要将您的注意力引向前面的几篇文章。我们已经介绍了GeForce RTX 3090核心的大部分底层技术,因此我们不会在这里再次介绍。如果您想了解一些背景故事,我们建议您查看我们对NVIDIA首次发布的GeForce RTX 30系列的报道、对其新功能和安培架构的更深入研究,以及上周的GeForce RTX 3080评论。一旦你把这些都消化了,你就会明白GeForce RTX 3090是怎么回事了。正如你在上面的详细规格细分和比较中看到的,新的GA102驱动的GeForce RTX 3090在几乎所有方面都得到了增强,几乎在所有方面都比上一代泰坦RTX更强大,除了两个方面。GeForce RTX 3090具有较低的默认提升时钟和较少的张量内核。GA102较新的架构和额外的资源足以弥补较低的默认提升频率,安培的第三代张量内核的吞吐量是上一代的两倍多,此外还支持其他类型的数学运算,如BLfoat16(BF16)和TensorFloat-32(TF32)。在像素和纹理填充率、内存带宽和计算性能方面,GeForce RTX 3090比基于图灵的泰坦RTX或任何其他同类产品都要强大得多。GA102图形处理器的芯片尺寸为628.4mm2,由大约280亿个晶体管组成。与基于图灵的上一代芯片相比,这些芯片也采用了较新的定制三星8 nm工艺(8N),后者在台积电上使用了12 nm的FinFET工艺。请注意,尽管封装了近100亿个晶体管,GA102的芯片尺寸却小了大约126 mm 2,这要归功于更先进的工艺。正如我们在前面的GeForce RTX 30系列和安培覆盖范围中提到的,所有这些额外的晶体管都用于实现新功能,如支持PCIe Gen 4,并增强安培对于几乎所有GPU工作负载的性能。例如,在图灵之前,NVIDIA的GPU架构只有一条数据路径。不过,第二个是用图灵添加的--一个用于浮点数,一个用于整数。有了安培,第二个整数路径已经通过额外的FP32单元得到了增强,因此浮点繁重的工作负载有更多的马力可供支配。安培的第二代RT(光线跟踪)内核也进行了优化,以获得更好的性能。GeForce RTX 3090中的82个RT内核(Titan RTX中的72个)提供了高达35.6 TFLOPS的多精度级别的计算性能(图灵上的计算性能为16.3-32.6 TFLOPS),第三代张量内核提供了高达284 TFLOPS的Int8性能,而Titan RTX上的性能为261 TFLOPS(是Int4的两倍)。我们还应该指出,第二代RT核的三角形交叉率是图灵的两倍,而那些第三代张量核对于稀疏矩阵(例如w中的矩阵)的数学性能是图灵的两倍。