欧洲首台百亿亿级超算,选择了Arm芯片
来源:内容由半导体行业观察(ID:icbank)编译自HPCwire ,谢谢。
欧洲第一台百亿亿次超级计算机Jupiter的配置已经敲定,这对于Nvidia来说是一场胜利,而对于x86芯片厂商Intel和AMD来说则是一场失望。Jupiter 超级计算机的建造成本为 2.73 亿欧元,它将搭配基于 ARM 架构的 SiPearl 的 Rhea 处理器和 Nvidia 的加速器技术。
该超级计算机由欧洲高性能计算联合组织 (EuroHPC JU) 以及包括 Eviden 和 ParTec 在内的财团建造。Eviden 是 Atos 旗下的一家公司,专注于包括 HPC 和 AI 在内的高级计算计划。
位于慕尼黑附近的于利希超级计算中心将托管该系统。安装将于 2024 年初开始。
具体来说,超级计算机的主计算集群将基于ARM CPU,并且初始配置不包括x86。全球排名前10的超级计算机中有6台是基于x86芯片的,只有1台是基于ARM的。
这对英特尔来说是一个巨大的失望,该公司去年宣布将投资 330 亿欧元建设新的芯片工厂并资助欧洲的研发计划。英特尔首席执行官帕特·基辛格还会见了欧盟领导人,以期在该地区获得更多业务。
Jülich 最快的系统 JUWELS 上次出现在 Top500 榜单中是在 2021 年 11 月,目前排名第 13 位。欧洲最快的超级计算机是芬兰排名第三的 Lumi,其峰值性能为 309 petaflops,排名第四的是芬兰的 Lumi。意大利的 Leonardo,峰值为 239 petaflops。
Jupiter于去年首次发布,被设计为一个模块化系统,其中多种类型的加速器可以插入核心系统。
该超级计算机是由几乎相同的团队建造的,包括 Atos(现在的 Eviden)和系统集成商 Partec,后者负责 44 petaflop JUWELS 超级计算机,该超级计算机于 2020 年安装了 AMD 的 Epyc 7402 芯片。
Jupiter 将采用基于 ARM Neoverse V1 CPU 设计的 SiPearl ARM 处理器。SiPearl 设计的 Rhea 芯片普遍兼容多种加速器,并且支持高带宽内存和 DDR5 内存通道。
Jupiter 将配备 Nvidia 的 Booster Module,这是一个集成系统,包括该公司的 GPU 和 Mellanox 互连。SiPearl 一直与 Nvidia 合作,将其 CPU 与 Nvidia GPU 连接起来。
目前的 JUWELS Booster Module 使用 Nvidia 的 A100 GPU,Jupiter 可以升级到 Nvidia 的 H100 GPU。Nvidia 尚未透露 H100 后续产品的详细信息,Jupiter 的安装将于三个月后开始。
尽管英特尔和AMD可能是Jupiter交易中的输家,但这并不妨碍他们的芯片被用于超级计算机。Jupiter 的模块化设计意味着 Jülich 可能会选择将这些公司的 GPU(不太可能是 CPU)添加到插入核心计算系统的模块中。
英特尔与 SiPearl 广泛合作,为 Rhea 带来对其 Ponte Vecchio 超级计算 GPU 的 OneAPI 支持。SiPearl 去年与 AMD 合作,使 Instinct GPU 与 Rhea 芯片兼容。Jülich还正在建设其机器学习和量子计算基础设施,超级计算中心希望将其作为托管在其设施中的加速器模块插入。
ARM 最近成为一家上市公司,它希望打破 x86 在超级计算领域的主导地位,因此将获得一席之地。安装在 Riken 计算科学中心的世界第二快的超级计算机 Fugaku 基于富士通的 ARM 处理器。
欧洲正在努力通过本土 CPU 设计实现硬件独立性,因此 Jupiter 选择 Rhea CPU 并不令人意外。
总部位于法国的 SiPearl 在欧洲处理器倡议的种子资金下开始开发 Rhea,该倡议希望开发开放式芯片设计,以减少对外国芯片技术的依赖。EPI 重点关注基于开源 RISC-V 架构的芯片设计。
与成熟的英特尔和 AMD 相比,SiPearl 是一家相对较新的芯片设计公司,目前面临着证明其芯片将支持 exaflop 性能的压力。
SiPearl 选择了 ARM,因为它已经成熟并准备好用于高性能应用。专家表示,RISC-V 距离主流服务器采用还有很多年的时间。EuroHPC JU 要求 Jupiter 供应商满足能源效率、性能、系统稳定性和可编程性要求。
Jupiter将运行经典的计算应用程序,也专为大语言模型等人工智能技术而设计。人工智能应用可能涉及创建加速药物发现的模拟,或模拟天气问题以做出预测或解决与气候变化相关的问题。
exaflop 性能预计将基于 LINPACK 基准。Nvidia、谷歌和其他公司发布了有争议的超级计算人工智能基准,通常报告性能超过 1 exaflop。
Top500 于 2021 年测试了混合精度 HPL-AI(用于加速器自省的高性能 LINPACK)基准,该基准将基于 ARM 的 RIKEN 的总体性能提升至 2.0 exaflops,而传统 LINPACK 测量的总性能为 442 exaflops。
Jupiter 也是欧盟在实现计算独立性和减少对专有技术依赖方面向前迈出的一大步。
欧盟委员会上个月通过了《欧洲芯片法案》,为制造、下一代半导体技术和研究提供了 430 亿欧元的公共资金。
该法规特别为 HPC 开放了 20 亿欧元,为人工智能开放了 16.7 亿欧元。高性能计算拨款与在欧盟内部采购和建设超级计算和量子基础设施有关。
然而,在建造世界上最快的超级计算机的竞赛中,欧洲仍然落后于美国、中国和日本。
预计美国将在未来几年内拥有两台百亿亿次超级计算机——橡树岭国家实验室的 Aurora 和劳伦斯利弗莫尔国家实验室的 El Capitan——这将再次将欧洲抛在后面。中国暗示多台百亿亿次超级计算机已经或预计将上线。
欧洲第二台百亿亿次超级计算机将于 2025 年底在法国启动并运行。EuroHPC JU 在 6 月宣布,该超级计算机将由 Jules Verne 财团托管和运营,该财团包括法国机构 GENCI(Grand Equipement National de Calcul Intensif)、 CEA(替代能源和原子能委员会)和荷兰国家超级计算中心 SURF。
Jupiter的总成本为2.73亿欧元,超过最初5亿欧元预算的一半。站起来木星的费用约有一半由 EuroHPC JU 资助,其余金额由德国联邦教育和研究部以及北莱茵-威斯特法伦州文化和科学部资助。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3544期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者