500强超算榜单出炉！AMD持续领跑，最新芯片将打破自创性能记录

公众号新闻

2023-05-25 11:05

新智元报道

编辑：拉燕

【新智元导读】最新500强超算名单出炉！AMD继续蝉联。

刚刚，世界上最快的500台超算名单出炉！AMD继续保持连胜，战绩斐然——500台超算中有121个系统用的都是AMD的芯片，同比增长29%。

此外，AMD自己的Frontier超算又在500强中脱颖而出，蝉联第一。

而基于相同架构的测试和开发系统也继续在Green 500榜单的能效指标中排名第二。

AMD还为Green 500榜单的前十名系统中的七个提供了芯片支持。专家表示，AMD驱动的Frontier超算仍然是地球上唯一一台完全合格的百亿亿级超级计算机。

英特尔驱动的竞品exaflop Aurora经过多年的推迟，仍未提交基准测试结果。而Frontier现在已全面投入运营了，并被研究人员用于大量科学工作，高下立判。

AMD继续领跑

Frontier在2022年6月已经以1.02exaflops的性能进入了500强榜单。而经过不断改进，现在已提高到1.194exaflops，增幅为17%。

与首次亮相时相同的8699904个CPU内核相比，这个增长幅度可以说是很大了。

对AMD来说，在500强中占据榜首位置是一个重要的里程碑，但许多其他AMD驱动的系统也名列榜首——由AMD CPU驱动的超级计算机继续占据前十名中的四个位置，而英特尔和IBM驱动的只占前十名中的两个。

AMD还为世界上最快的20个系统中的12个提供硬件支持。不过，英特尔的CPU仍然在榜单中占据主导地位，500强中，英特尔支持的系统总数高于AMD。

然而，AMD从未停止扩大占比，去年上榜的44个新超算中有21个采用的是AMD的芯片。

此外，AMD CPU在2016年还只为500强榜单上的13台超级计算机提供支持，但现在这个数字已经达到了121台，这得益于AMD更新的EPYC处理器。

与此同时，英特尔从2016年的454台的支持量减少到今天的360台，其中许多采用Xeon芯片的机器都可以追溯到近十年前了。

可见，从发展的速度和潜力上看，AMD无疑表现的更加出色。

不仅如此，Frontier在HLP-MxP基准测试中也位居世界第一。

HLP-MxP基准测试是衡量混合精度工作中HPC和AI性能的指标，AMD达到了9.95exaflops（比之前的7.9exaflops得分有所提高）。

与此同时，采用AMD技术的LUMI超算以2.2exaflops的分数位居第二。除了HLP-MxP，Frontier在HPCG基准测试中也排名第二，该基准测试比Linpack更注重系统级的性能。其HPCG-Pflops为14.05。

同时，采用AMD技术的LUMI以3.41HPCG-Pflops位居第二，而Fugaku则以16HPCG-Pflops位居榜首。

总的来看，AMD继续跻身超算500强、Green 500榜单、HPCG，以及HLP-MXP基准测试的前列。

同时，AMD在榜单中新超算的占比，也突显出AMD的CPU与I竞争对手相比具有性能优势。

专家预计，该趋势和技术占比往往会渗透到更广泛的数据中心市场，AMD的EPYC服务器芯片预计在明年的前景一片大好。

然而，由AMD Instinct MI300芯片支持的2-exaflop El Capitan 超级计算机在未来可能会从Frontier手中把第一名的位置抢过来。

Instinct MI300有多厉害？咱一起来看一看。

Instinct MI300

先来看看它长得有多帅。

毫无疑问，Instinct MI300将会是一个颠覆行业的设计——APU混合了总共13个小芯片，其中许多是3D堆叠的，创建了一个具有24个Zen 4 CPU内，并融合了CDNA 3图形的芯片引擎和8堆HBM3。

总体而言，该芯片拥有1460亿个晶体管，是AMD投入生产的最大芯片。

此外，MI300拥有1460亿个晶体管，轻松超过了英特尔的1000亿个晶体管Ponte Vecchio，再加上128GB的HBM3内存，能打到爆表。

我们可以清晰地看到中心芯片侧面的八个HBM3堆栈。HBM堆栈之间是小的结构硅片，以确保在封装顶部拧紧冷却溶液时的稳定性。

该芯片的计算部分由九个5nm小芯片组成，它们是CPU或GPU内核，但AMD没有详细说明每个小芯片的使用数量。

Zen 4内核通常部署八核裸片，因此我们可以看到三个CPU裸片和六个GPU裸片。GPU芯片使用AMD的CDNA 3架构。

这九个裸片被3D堆叠在四个6nm基础裸片之上，这些裸片可以处理I/O和各种其他功能。

在另一个展示出来的MI300样品中，顶部裸片被砂带打磨机打磨过，我们就能看到四个有源中介层裸片的架构。

我们可以清楚地看到不仅可以在 I/O 块之间实现通信的结构，还可以看到与HBM3堆栈接口的内存控制器之间的通部分。

3D堆叠设计允许在CPU、GPU和内存芯片之间实现巨大的数据吞吐量，同时还允许CPU和GPU同时处理内存中的相同数据，从而节省电力、提高性能并简化编程。

AMD的发言人不愿透露更多细节，因此我们不清楚AMD是使用标准的TSV方法将上下裸片熔合在一起，还是使用更先进的混合键合方法。

AMD表示，MI300提供的AI性能是Instinct MI250的8倍，每瓦性能是Instinct MI250的五倍。

AMD还说，它可以将ChatGPT和DALL-E等超大AI模型的训练时间从几个月缩短到几周，从而节省数百万美元的电费。

当前一代的Instinct MI250为Frontier超算提供动力，这是世界上第一台百亿亿级计算机，而Instinct MI300 将为即将推出的两台exaflop El Capitan超算提供动力。

AMD告诉我们，这些halo MI300芯片价格昂贵且相对稀有，因此它们不会像EPYC Genoa数据中心CPU那样得到广泛的应用。

据悉，该芯片还将与英伟达的Grace Hopper Superchip竞争，后者在同一块板上结合了Hopper GPU和Grace CPU。

基于Neoverse的Grace CPU支持Arm v9指令集，并且系统配备了两个与英伟达新品牌NVLink-C2C互连技术融合在一起的芯片。

但不管怎么说，超算芯片这一方面，AMD持续领跑。

参考资料：

https://www.tomshardware.com/news/amd-instinct-mi300-data-center-apu-pictured-up-close-15-chiplets-146-billion-transistors

https://www.tomshardware.com/news/amd-now-powers-121-of-the-worlds-fastest-supercomputers

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。

来源: qq

点击查看作者最近其他文章