Redian新闻
>
印度Arm处理器曝光,全球最强?

印度Arm处理器曝光,全球最强?

公众号新闻

来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢


目前,地球上最强大的 Arm 处理器是富士通的48 核 A64FX 处理器,它是为日本 RIKEN 实验室的“Fugaku”超级计算机创建的高度矢量化计算引擎。Nvidia 正准备推出其72 核“Grace”Arm CPU,该 CPU 尚未给出产品名称,但 CG100 似乎合乎逻辑。但两者都将面临来自印度新来者的激烈竞争。


据透露,来自印度高级计算发展中心(C-DAC)设计的 Aum HPC 处理器有非零的机会超越 A64FX 和 Grace,甚至在与亚马逊的 64 核 Graviton3 芯片和Ampere Computing 的 Altra、Altra Max 和AmpereOne 处理器于通用的工作负载上相比,更物有所值。


Aum HPC 处理器的细节本周曝光,Aum HPC 处理器是在印度政府国家超级计算任务的支持下开发的,我们看到的演示文稿是由C-DAC 的 HoD HPC Technologies Group 高级总监Sanjay Wandhekar 整理的。


该任务汇集了印度科学研究所、科学技术部、电子和信息技术部以及 C-DAC,旨在为政府带来从处理器到完整系统和软件的 HPC 独立性印度和需要 HPC 处理的组织,大概还有印度行业巨头,他们可能也不希望依赖外部来源的芯片、系统和软件来处理他们的 HPC 和 AI 工作负载。这不仅是一项技术工作,也是一项与制造和数据中心设计相关的工作,重点是为最强大的——我们假设是百亿级——机器提供液体冷却。


除了拥有免于进口到印度的 HPC 部件和系统的供应链外,印度政府也很想知道,毫无疑问,它用于部署 HPC 的硬件或软件中没有安全后门和人工智能应用。鉴于印度是核大国,与中国接壤,与俄罗斯仅咫尺之遥,不难理解印度为何拥抱Arm架构并做定制处理器。当巴基斯坦也与印度接壤并且拥有与印度大致相同数量的核武器时,它也做定制处理器也就不足为奇了,也许它会基于 RISC-V?


Aum HPC 处理器并不局限于 HPC 市场,我们可以预期它的变体也将用于 AI 和通用云计算领域。该芯片预计将于 2024 年上市,最初将部署在性能超过 1 petaflops 的试点 HPC 系统中(大概这是理论峰值性能)。之后,印度政府希望“准备好基于 Aum CPU 的百亿亿次级系统设计和子系统”。


为了创建 Aum 处理器,C-DAC 的技术人员研究了 RIKEN 的 A64FX 处理器和 Fugaku 系统,以及它的前身 Sparc64-VIIIfx 处理器和 K 超级计算机,密切关注我们在 HPCG 基准测试数据中看到的一切。获得更好的内存带宽与每秒浮点运算的比率。事实上,K 系统的字节/触发器比率为 0.5,在 HPCG 测试中提供了 5.2% 的峰值 HPL 性能,而 Fugaku 的字节/触发器比率为 0.38 字节/触发器比率,峰值额定值为 3%。因此 C-DAC 决定尝试将每触发器内存带宽比率提高到 0.5 以上。此外,C-DAC 希望远离 GPU 和其他加速器以及更易于优化的相对较小的矢量,并提供 HBM 和 DDR 主存储器的混合以及大量具有 CXL 一致性支持的 PCI-Express I/O 通道.


下面是 Aum CPU 的框图:



如您所料,C-DAC 选择了 Arm Holdings 的“Zeus”Neoverse V1 核心,并将其中的 48 个核心封装在一起。我们不知道它是否使用 chiplet 架构,但是这个 A48Z 芯片,正如它的名称,看起来像一个单片设计,如下图所示。


A48Z 上的内存子系统支持八个运行频率最高为 5.2 GHz 的 DDR5 内存通道,并有一对运行频率为 6.4 GHz 的 HBM3 内存控制器,在初始版本中已降为 5.6 GHz。HBM3 内存可扩展到每个双小芯片封装 64 GB,这不是一个巨大的内存量,但通过 DDR5 内存进行了扩充。像这样:



Aum 封装将包括一对这样的 48 核小芯片,它们使用完全一致的芯片到芯片 (D2D) 互连相互连接。


Nvidia 正在为 Grace CPU 进行客户 Arm V9 核心设计,而 C-DAC 和 AWS 在各自的 Graviton3/3E 和 Aum 设计中坚持使用 Arm V8.4-A 级别的Neoverse V1 核心。两个小芯片 Aum CPU 封装共有 96 个内核,这些内核之间有 96 MB 的二级缓存,另外还有 96 MB 的系统级缓存在内核之间共享,并在 DDR5 和 HBM3 内存与二级缓存之间进行缓冲。


除了 D2D 互连之外,还有另一种基于 Xilinx 创建并得到 Arm Holdings 认可的 CCIX 协议的芯片到芯片互连 (C2C),这将允许多个封装以 NUMA 方式相互链接,具有完整的内存一致性。目前尚不清楚 CCIX NUMA 可以推到多远,但两个插槽是最小的并且已经公开,但在某些时候可能支持四个插槽以用于大内存服务器占用空间,如果 C2C 互连则完全有可能支持八个插槽有足够的车道。每个 Aum 小芯片有 64 条 PCI-Express 5.0 连接通道,总共 128 条通道,我们认为其中 64 条通道被占用以提供两个 Aum 插槽之间基于 CCIX 协议的 NUMA 链接,就像 AMD 所做的那样它的 Epyc 处理器使用 Infinity Fabric 协议。



C-DAC 表示,一个 Aum 节点(大概有两个 CPU)将提供大约 10 teraflops 的峰值计算。一个双路 Aum 服务器将有足够的带宽来添加四个 GPU 加速器。


我们不知道将内核连接到 A48Z 小芯片上的控制器的连贯网格是从 Arm Holdings 获得许可还是自主开发。它可能是从 Arm Holdings 获得许可的。


看起来 Aum 处理器的基本时钟速度为 3 GHz,涡轮增压速度超过 3.5 GHz。凭借提供 332.8 GB/秒带宽的 16 通道 DDR5 内存和提供 2.87 TB/秒带宽的 64 GB HBM3 内存(每个 A48Z 小芯片两个 16 GB 堆栈),Aum 封装将为每个插槽提供超过 4.6 teraflops 和 3 TB/秒的总内存带宽,每触发器 0.7 字节令人印象深刻。



所有这一切都在一个 300 瓦的热设计点中。Fugaku 的 A64FX 处理器、HBM2 内存和 Tofu D 互连的重量约为 170 瓦。Fugaku 系统具有卓越的能效指标。


这是 Wandhekar 扔进甲板上的一张有趣的图表:


👇👇 点击文末【阅读原文】,可查看原文链接!

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3405期内容,欢迎关注。

推荐阅读


躺着挣钱的芯片生意,苹果要丢了?

你真的懂PCIe吗?

韩国芯片,想再赢一次


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一天到晚瞎想出这些个英特尔分享最新的路线图:144核处理器,18A工艺英特尔酷睿 Ultra 7 1002H 处理器曝光,16 核 22 线程五十三 训斥俄罗斯公布全新PC电脑:自研4核ARM处理器 +魔改 Linux 系统加持英特尔至强 W3400 系列工作站处理器国行定价公布,W5-3435X 17999 元OpenAI 的秘密武器曝光,ChatGPT 爆火的幕后功臣原来是他ARC处理器汽车技术论坛周四直播,主讲使用 ASIL Ready 认证处理器 IP 开发功能安全的汽车系统壹号本 OnexPlayer 3 in 1 PC 掌机新品即将发布,搭载英特尔酷睿 i7-1370P 处理器AMD:最新架构锐龙 7000 移动处理器采用橙色贴纸骄傲!加拿大再次被评为2023年全球最受欢迎旅游国家之一!全球最佳城市被他摘下!消息称搭载 R9 7940H 处理器的迷你主机 5 月推出,GMK 全球首发谷歌 Tensor G3 处理器规格曝光,Pixel 8系列有望搭载三强争霸:纳指100、纳指科技、标普信息科技谁最强?GPGPU流式多处理器架构及原理Jim Keller公布:自研RISC-V处理器性能惊人,Raja Koduri “加盟”英特尔酷睿Ultra 1代处理器核显曝光,最高1024流处理器ARC处理器汽车技术论坛上线,直播讲解使用 ASIL Ready 认证处理器 IP 开发功能安全的汽车系统4499 元,戴尔 2023 款成就 3430 轻薄本上架:搭载 13 代酷睿 i5-1335U 处理器2024学年CUG英国大学学科排名揭秘:会计金融、工程、教育... 哪些英国大学最强?走进沙特之三:麦加CPU处理器架构、微架构及授权模式iPhone 15设计图泄秘!超窄边框+固态按钮,处理器这次可能有点不一样…VAIO F16 大屏轻薄本发布:搭载 13代酷睿 U 系列处理器,1.65kg 重《空港(くうこう)》Kunpeng处理器组织及芯片架构在线研讨会预告:Formal DPV在嵌入式AI处理器的案例验证一季度上市险企大扫描:净利润增超五成,哪家最强?华硕预告全球最轻 14 英寸商务本 ExpertBook B9,升级 13 代酷睿博锐处理器微软英伟达领投,2万张H100打造全球最强超算!一跃成为OpenAI最强劲敌!原装6Hz、超频体质,为什么这块处理器是攒机佬的梦中情U?7月3号全球最热,但4号也是全球最热,6号还是全球最热中国货运飞船天舟六号,为何是世界现役最强?苹果WWDC定档6月/周鸿祎展示「360GPT」/ iPhone 15 Pro系列或采用超低能耗处理器五十四 平定
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。