德国法兰克福、加利福尼亚州伯克利和田纳西州诺克斯维尔-在第55届TOP500排行榜上,由日本推出的一款新的排名第一的系统带头,榜单上出现了一些重要的新成员。最新的排名还反映出总业绩和能效的稳步增长。
新的顶级系统Fugaku上交的高性能LINPACK结果为415.5 petaflops,比现在排名第二的Summit系统高出2.8倍。Fugaku采用富士通的48核A64FX SoC,成为榜单上第一个采用ARM处理器的系统。在机器学习和人工智能应用程序中经常使用的单个或进一步降低的精度中,Fugaku的峰值性能超过1000petaflops(1exaflops)。新系统安装在位于日本神户的理研计算科学中心(R-CCS)。
排名第二的是顶峰(Summit),这是一台由ibm制造的超级计算机,在高速缓冲存储器上可提供148.8千万亿次浮点运算。该系统有4356个节点,每个节点配备两个22核Power9 CPU和六个NVIDIA Tesla V100 GPU。节点通过Mellanox双轨EDR InfiniBand网络连接。顶峰在田纳西州橡树岭国家实验室(ORNL)运行,仍然是美国运行速度最快的超级计算机。
排名第三的是Sierra,这是加利福尼亚州劳伦斯利弗莫尔国家实验室(LLNL)的一个系统,在HPL上达到了94.6千万亿次浮点运算。它的架构与Summit非常相似,在其4,320个节点中的每个节点中都配备了两个Power9 CPU和四个NVIDIA Tesla V100 GPU。Sierra采用与系统互连相同的Mellanox EDR InfiniBand。
神威太湖之光,由中国国家并行计算机工程技术研究中心(NRCPC)开发的系统跌至第四位。该系统完全由Sunway 260核心SW26010处理器供电。自2016年6月安装在中国无锡国家超级计算中心以来,其93petaflops的HPL标志一直保持不变。
排名第五的是天河-2A(银河-2A),这是中国国防科技大学(NUDT)开发的系统,其61.4千万亿次的HPL性能是采用英特尔至强CPU和定制Matrix-2000协处理器的混合架构的结果。它部署在中国广州的国家超级计算机中心。
榜单上的新系统HPC5占据了第六名的位置,HPL的性能为35.5千万亿次浮点运算。HPC5是戴尔制造的PowerEdge系统,由意大利能源公司埃尼公司(Eni S.p.A)安装,使其成为欧洲运行速度最快的超级计算机。它采用Intel Xeon Gold处理器和NVIDIA Tesla V100 GPU,并使用Mellanox HDR InfiniBand作为系统网络。
另一种新系统Selene排在第七位,HPL得分为27.58petaflops。它是DGX超级吊舱,由NVIDIA的新型“Ampere”A100图形处理器和AMD的EPYC“罗马”CPU驱动。Selene安装在美国的NVIDIA。它也使用Mellanox HDR InfiniBand作为系统网络。
安装在美国德克萨斯州高级计算中心(TACC)的Dell C6420系统Frontera在榜单上排名第八。其23.5HPL petaflops采用448,448个Intel Xeon内核。
排名前十的意大利系统是安装在CINECA研究中心的Marconi-100。它由IBM Power9处理器和NVIDIA V100 GPU驱动,采用双轨Mellanox EDR InfiniBand作为系统网络。马可尼-100的21.6千万亿次运算使其在榜单上名列第九。
排在前十位的还有Piz Daint,19.6petaflops,这是一款安装在瑞士卢加诺瑞士国家超级计算机中心(CSCS)的Cray XC50系统。它配备英特尔至强处理器和NVIDIA P100 GPU。
聚合列表性能现在为2.23exaflops,高于6个月前的1.65exaflops。这一增长的大部分是新的头号Fugaku超级计算机的结果,而榜单上的新入口点(系统号500)为1.24petaflops,仅比之前的榜单略有增加。总体而言,榜单上的新系统数量只有51个,是自1993年TOP500开始以来的最低纪录。
在系统数量方面,中国继续占据TOP500的主导地位,声称有226台超级计算机上榜。美国以114个系统位居第二;日本以30个位居第三;法国有18个;德国声称有16个。尽管美国在系统数量上排名第二,但在总性能排行榜上,美国仍以644千万亿次的运算超过中国的565千万亿次。日本的系统数量明显较少,提供了530千万亿次浮点运算。
榜单上共有144个系统在使用加速器或协处理器,与六个月前报告的145个几乎持平,与过去一样,大多数配备加速器/协处理器的系统(135个)都在使用NVIDIA GPU。
x86仍然是占主导地位的处理器体系结构,出现在500个系统中的481个系统中。英特尔声称其中有469款,AMD安装在11款,Hygon安装在其余一款,仅有四款TOP500系统采用了ARM处理器,其中三款采用了新款富士通A64FX处理器,其余一款采用了Marvell的ThunderX2处理器。
系统互联份额的细目与六个月前基本持平。263个系统使用以太网,150个系统使用InfiniBand,其余系统使用自定义或专有网络。尽管以太网在绝对数量上占据主导地位,但这些系统提供了471千万亿次浮点运算,而基于InfiniBand的系统提供了803千万亿次浮点运算。由于它们在榜单上一些最强大的超级计算机中使用,具有自定义和专有互连的系统加起来可达到790千万亿次浮点运算。
中国制造商在安装数量上占据主导地位,在500个系统中,联想(180个)、Sugon(68个)和Inspur(64个)占312个。HPE声称有37个系统,而Cray/HPE有35个系统。富士通只有13个系统,但由于其排名第一的Fugaku超级计算机,该公司以478petaflops的综合性能位居榜首。联想拥有180个系统,以355petaflops的性能位居第二。
Green500上最节能的系统是基于首选网络公司的新服务器的MN-3。在其1.62petaflops的性能运行中,它达到了创纪录的21.1千兆次浮点运算/瓦。该系统的卓越能效来自MN-Core芯片,这是一种针对矩阵运算进行了优化的加速器。它在TOP500排行榜上排名第395位。
排在第二位的是新的NVIDIA Selene超级计算机,这是一款由新的A100 GPU驱动的DGX A100超级吊舱。它在TOP500指数中占据第七位。
排在第三位的是NA-1系统,这是一种安装在日本NA模拟公司的Pezy计算/Exascaler系统。它达到了18.4千兆浮点/瓦,在TOP500指数中排名第470位。
Green500上的9号系统是性能最好的Fugaku超级计算机,每瓦可提供14.67亿次浮点运算。它在能效方面仅次于达峰,后者达到了14.72千兆浮点/瓦。
TOP500榜单纳入了高性能共轭梯度(HPCG)基准测试结果,该测试结果提供了评估超级计算机性能的替代指标,旨在补充HPL测量。
排名第一的TOP500超级计算机Fugaku现在也是HPCG基准测试的领先者,其HPCG-petaflops达到了创纪录的13.4HPCG-petaflops。在HPCG基准中,美国能源部的两个系统,ORNL的Summit和LLNL的Sierra,现在分别排在第二和第三位。Summit达到2.93HPCG-petaflops和Sierra 1.80HPCG-petaflops。所有剩余的系统实现的HPCG-petaflops都不到1HPCG-petaflops。
今天的TOP500榜单的第一个版本始于1993年6月在德国举行的一次小型会议的演习。出于好奇,作者决定在1993年11月重温这份榜单,看看情况发生了怎样的变化。大约在那个时候,他们意识到他们可能正在做一些事情,并决定继续编制这份榜单,这现在是一年两次的备受期待、备受关注和备受争议的活动。
TOP500榜单由劳伦斯伯克利国家实验室的Erich Strohmaier和Horst Simon,田纳西大学诺克斯维尔分校的Jack Donarra和德国ISC集团的Martin Meuer编制。