美光披露GDDR6X细节:内存的未来,还是专有的DRAM?

2020-09-07 10:55:01

在上周的虚拟简报会上,美光科技分享了英伟达GeForce RTX 30系列显卡使用的最新GDDR6X SGRAM的更多细节。该公司透露,它已经试验了十多年的使新型存储器成为可能的技术,并表示GDDR6X SGRAM还没有被JEDEC标准化。目前,只有NVIDIA使用GDDR6X内存,但美光希望这种情况会随着时间的推移而改变。可以吗?

美光位于德国慕尼黑的图形DRAM设计中心,自从设计中心属于Qimonda以来,就有了图形存储器创新的历史。Qimonda是从英飞凌(Infineon)剥离出来的一个早已不复存在的DRAM。这些实验室的工程师将业界第一款GDDR5、GDDR5X以及现在的GDDR6X芯片投入批量生产。事实上,美光是GDDR5X的唯一生产商,现在是GDDR6X的唯一生产商。

四电平脉冲幅度调制(PAM4)信令是GDDR6X存储器的关键功能。这项技术使用四个信号电平在每个周期传输两个数据比特,从而使任何工作频率的有效带宽与上一代SGRAM类型相比翻了一番。此外,PAM4为更高的数据传输速率打开了大门(尽管是有成本的)。因此,PAM4提高了每时钟效率和速度。

不过,有一个小小的警告。GDDR6的突发长度为16字节(BL16),这意味着它的两个16位通道中的每个通道每次操作都可以传输32字节。GDDR6X的突发长度为8字节(BL8),但由于PAM4信令,它的每个16位通道每次操作也将提供32字节。为此,在相同时钟下,GDDR6X并不比GDDR6快。

PAM4信令已用于数据中心网络标准(如Infiniband)多年,四级编码本身并不是什么新鲜事。与传统的PAM2/NRZ调制相比,PAM4保留给大型数据中心和超级计算机的主要原因是其实现成本。

但高昂的成本并不妨碍在实验室中探索这项技术,这也是美光美国分公司的科学家自2006年以来一直在做的事情。在这个过程中,他们已经获得了45项专利。

美光的图形部门主管拉尔夫·埃伯特(Ralf Ebert)说,从2006年开始,我们就让科学家们研究如何利用内存中的PAM4。我故意说是科学家,因为我会区分开发人员和科学家。这些人是真正为创新做基础工作的人。他们基本上采用了PAM4技术,并试图找出如何在DRAM中使用该技术。

经过多年的PAM4探索,美光认为是时候将这项技术应用于图形存储器了。GDDR从2007年(GDDR5)到2018年(GDDR6)的演变在架构方面相当简单(尽管回到了BL8),因此引入新的信令方案需要美光将其来自美国的科学家和来自德国的工程师聚集在一起。

埃伯特说,科学家们必须与签署芯片的GDDR开发人员并肩工作。他们还与从系统和大规模制造角度理解挑战的系统和产品工程师进行了非常密切的合作。

我们今天所知的GDDR6X的工作始于不到三年前的2017年底。通常,将一种新型DRAM推向市场需要的时间要长得多,但由于这主要是一个内部项目(至少在存储设备层面),美光已经拥有的技术的实施进展非常迅速。不过,这是有原因的。

新型存储器的开发不仅考虑到了某些应用,而且也考虑到了某些客户。NVIDIA是第一家使用GDDR5X和GDDR6的公司(早在21世纪初就使用了GDDR2和GDDR3),所以它很早就与美光公司合作开发GDDR6X项目也就不足为奇了。事实上,根据美光的说法,NVIDIA要求美光提供一种可以提供比GDDR6更高性能的离散存储器解决方案。

";当然,[…]。你必须与客户合作,埃伯特说。您必须确定要与之合作的客户,最好是依赖已建立多年的密切业务和技术协作。[我们必须确保]产品从一开始就能在应用程序中正常工作。

NVIDIA不得不为GDDR6X开发全新的内存控制器和PHY,因为PAM4信号改变了内存子系统的一般工作方式。基于到目前为止还没有IP设计公司宣布他们的GDDR6X产品的事实,NVIDIA看起来一切都是由NVIDIA自己设计的。

目前,NVIDIA在其基于GA102图形处理器的GeForce RTX 3080/3090显卡上使用GDDR6X,GA102图形处理器主要面向游戏玩家。最终,该公司还将提供采用相同芯片和GDDR6X内存的Quadro RTX专业显卡。与此同时,美光表示,GDDR6X还用于人工智能和HPC应用,这两种应用都不在Nvidia的GeForce RTX(因为这些卡在人工智能的FP16和FP32张量性能以及HPC的FP64性能方面有上限)和Quadro RTX Focus。也许美光意味着假设的用途,或者它暗示即将推出的由GA102驱动的NVIDIA Titan系列卡将为AI和HPC提供正确的性能(没有上限)。

NVIDIA是美光唯一的GDDR6X发布合作伙伴,但美光强调,它并不是专门为GPU开发人员设计新型内存的。这家DRAM制造商还计划向其他公司提供GDDR6X。

埃伯特说:我们现在开始向业界提供和开放GDDR6X,GDDR6X不是特定于客户的。我们希望其他客户有兴趣继续前进,然后我们也会与他们接触。

美光表示,PAM4要求它重新设计其GDDR6X存储设备中的写入数据捕获电路(接收器),以准确采样和解析四个不同的信号电平。为此,每个GDDR6X DRAM的每个I/O和数据总线反转(DQ/DBI)引脚都集成了三个输入子接收器。主机可以在写入训练序列期间微调参考VREFD电压电平。GDDR6X的输出驱动器也必须重新设计,但美光表示,重新设计依赖于传统方法。

美光承认,GDDR6X芯片的生产成本高于上一代GDDR6设备。此外,它们需要非常干净和稳定的信号,这就是为什么驱动GeForce RTX 3080/3090卡的NVIDIA GA102 GPU的内存控制器现在位于自己的电源线上,以确保非常干净和稳定的电源。

说到功耗,有必要指出的是,由于性能大大提高,GDDR6X在设备级别的能效比GDDR6高15%(7.25pJ/比特对7.5pJ/比特),根据Micron的说法,GDDR6X的能效比GDDR6(7.25pJ/比特比7.5 pJ/比特)高15%。

总体而言,GDDR6X芯片及其实现比GDDR6更昂贵,但根据美光的说法,它仍然比HBM2级内存便宜得多。GDDR6X不需要堆叠,而且它是以分立芯片的形式发货的,可以在工厂焊接下来。分立DRAM的整个基础设施已经存在了几十年,所有的过程都很熟悉,成本也很低。相比之下,HBM2 KGSD(已知良好的堆叠芯片)必须在半导体制造厂组装,然后放在另一家制造厂洁净室中GPU旁边的插入器上。

Ebert说,性能更高的DRAM通常也会带来更高的成本。GDDR6X的最大优势是,我们可以将性能标准推得更高,同时仍然保持在一定的成本范围内。这是因为GDDR6X仍然是一个离散内存解决方案。GDDR6X存储器可以像PCB上的任何其他存储器一样由插入式电路板制造商在其标准环境中组装。当您查看不同速度等级的内存时,成本加法器通常有几个范围;我们将我们的GDDR6X定位在与典型范围一致的位置。对于客户来说,这不是一个成本极高的产品,这主要是因为它仍然是一种离散存储器解决方案。

美光没有透露其8 GB GDDR6X设备的芯片大小,也没有将其与其8 GB GDDR6设备进行比较。该公司强调,这是第一款使用PAM4信号的存储器,后者是一项突破,为各种创新打开了大门。

美光的图形DRAM总监表示:PAM4是一个挑战,我们相信,有了这一突破,这一点是可以向前推进的。我们相信,这将改变DRAM行业。我们是第一批做到这一点的人,我们已经为此努力了很长一段时间。

目前,美光提供额定19Gbps和21Gbps的8 GB GDDR6X芯片。新的存储设备采用该公司经过验证的第四代10纳米级工艺技术(也称为1αnm)生产。该公司在容量和速度方面都有扩展GDDR6X的路线图。

明年,美光打算在产品阵容中增加16 GB的密度,并随着时间的推移提供更快的芯片。目前,美光是GDDR6X的唯一生产商,NVIDIA是唯一的客户,因此GDDR6X的发展取决于NVIDIA的需求和美光的量产能力。这里的关键信息是,GDDR6X的性能将扩展到超过21 Gbps。

为了尽快敲定GDDR6X并使其与NVIDIA的安培图形处理器一起工作,两家公司几乎是在隐形模式下工作。这两家公司从未将该规范提交给JEDEC进行标准化,因此GDDR6X是目前只能从美光获得的专有类型的存储器。

Ebert说,目前,它还没有提交给JEDEC进行标准化。

GDDR5X在很大程度上是由美光开发的,几乎没有来自行业其他公司的投入(如果有的话)。JEDEC在美光公司开始批量生产GDDR5X之前正式发布了该标准,并将其提供给该组织的成员。然而,除了NVIDIA,没有人使用GDDR5X,除了美光,没有人生产这种类型的存储器。

传统上,GDDR类型的内存几乎仅用于显卡和游戏机。有了GDDR6,美光和它的行业同行开始为其他需要高带宽的应用推广图形DRAM。在潜在的使用案例中,他们瞄准了汽车、网络和FPGA应用。美光希望GDDR6X能够面向非GPU市场,但它在这里并没有做出任何真正的承诺。

如今,GPU被广泛用于各种人工智能应用,因此,当美光在谈到用于非图形垂直领域的GDDR6X时,培训和推理应用自然也会被提及。同时,由于NVIDIA的Titan系列显卡瞄准了游戏玩家、人工智能爱好者和各种消费者,如果NVIDIA推出Titan Ampere型号,美光的GDDR6X将在技术上满足这些市场。

为了迎合新兴市场,美光不仅需要提供内存本身,还需要提供内存控制器IP、PHY IP和验证IP。这些类型的东西是由Avery、Cadence、Rambus和Synopsys等IP设计公司提供的。由于GDDR6X的征程才刚刚开始,知识产权公司将不得不迎头赶上,假设它们看到了该行业对GDDR6X的潜在需求。这并不是完全有保证的,特别是考虑到GDDR6X不是JEDEC支持的行业标准。

埃伯特说,从历史上看,没有什么能阻止该行业使用带CPU的GDDR DRAM。";在这种情况下也是如此。但这是CPU公司必须做出的决定。

对于美光来说,GDDR6X不仅是一款高度完善的产品,而且是其将PAM4信号引入DRAM的工作的顶峰。虽然这种类型的编码不会用于DDR5 SDRAM,但美光认为,从长远来看,这是内存的未来。

因此,GDDR6X是我们推出PAM4的地方,我们绝对可以看到这一趋势正在向前发展,美光图形内存总监表示。PAM4有可能用于其他内存标准。这种类型的技术有可能或很可能会被拥有CPU或我们的其他处理器的公司使用。

PAM4确实将被业界使用得比现在广泛得多。PCIe 6.0将于2021年推出,它使用PAM4信令来提高效率和数据速率。考虑到PCIe的广泛采用,CPU和ASIC公司最终一定会同时支持PCIe 6.0和PAM4。业界一旦学会如何用PCIe 6.0进行四电平脉冲调幅,肯定会将其应用到别处。

美光表示,它首先在LPDDR测试芯片上实现了PAM4,以试验这项技术。此外,我们在准备这篇报道时发现的一项专利表明,美光在三年前获得了带有PAM4和PAM8信号的堆叠式HBM级存储器的专利。

HBM类型的存储器还必须采用离散DRAM设备(QDR、BL8/BL16等)使用的大量内容,因此很难预测它何时可以采用新的信令。但如果目前可用的HBM2E 3.6Gbps芯片采用4级脉冲幅度调制,则每个设备的带宽将翻一番,达到922 GB/s,这意味着一个6模块的6144位DRAM子系统将提供高达5.5 TB/s的带宽。不过,在这一点上,这纯粹是猜测。

美光的GDDR6X是业界第一款大规模生产的使用四级脉冲幅度调制信号(PAM4)的存储器。新类型的编码使用四个信号电平(在PAM2的情况下是一个比特)每周期传输两个数据比特,并打开通向更高频率的大门。自2006年以来,美光一直在试验PAM4,他认为PAM4不仅是GDDR的发展,而且是整个DRAM的发展。虽然DDR5不使用PAM4,但美光已经申请了PAM4的专利,甚至还有支持PAM8的HBM内存。

这家DRAM制造商承认,与GDDR6相比,GDDR6X更难构建和实现(而且可能更昂贵)。然而,即使在它的初级阶段,GDDR6X也比成熟的HBM2E便宜,因为我们在这里处理的是分立的内存芯片。同时,由于GDDR6X返回到8字节的突发长度(在GDDR6的情况下为16字节),因此在相同的每针数据速率下,它不比其前身GDDR6快。

在这一点上,GDDR6X最大的警告是,它是由美光单独开发的,一些来自NVIDIA的投入。美光尚未向JEDEC提交该标准,目前尚不清楚GDDR6X是否会成为行业标准。美光希望GDDR6X能用于非图形应用,但如果没有其他公司的支持,很难推广这种新型内存。

2021年的PCIe 6.0?你在跟我开玩笑吗?如果事情继续这么快,那么我认为GDDR6应该取代DDR…。DDR应该成为历史,就像SDR现在已经成为历史一样。

回覆。

PCIe 4被大大延迟了。应该早在几年前就出来了。PCIe 5已经接近完成iIRC。

回覆