超越 X86,AWS自研Arm芯片,正式走向HPC
来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢。
当谈到在云中部署 Arm 时,最近的很多讨论都集中在效率、核心密度或性能可预测性等方面。
然而,Amazon Web Services 认为,其 Arm 芯片可以在性能和性价比方面具有竞争力,并且在非常挑剔的 HPC 市场上,可以使用 Graviton3E 处理器。
AWS 于 2022 年初展示了其第三代 Graviton 处理器。这个 550 亿个晶体管部件封装了 64 个运行频率为 2.6 GHz 的 Arm Neoverse V1 内核,并且基于小芯片设计。它拥有550亿个晶体管、DDR5内存并支持PCIe 5互连,提供了 300 GB/秒的内存带宽。这家云巨头于 2022 年 11 月推出了 Graviton3E,它针对 HPC 和网络作业进行了调整,并对浮点和向量数学进行了优化。亚马逊表示,与 Graviton3 比较,Graviton3E的矢量性能提高了 35%,Linpack 性能提高了一倍。与 Graviton2 相比,3E 提供的内存带宽高出 50%,加密和浮点性能高出两倍。
AWS 声称 Graviton3E 的能效比基于 x86 的前代产品(基于 AMD 的 Epyc 芯片)高 60%。AWS 没有分享 HPC7g 或 Graviton3E 与 x86 服务器同类产品的原始性能比较。
除了 CPU 之外,亚马逊还展示了更新的Elastic Fabric Adapter (EFA) 低延迟网络接口,用于将多个 Graviton 实例拼接在一起。
这两款产品都是AWS Hpc7g实例的核心,提供三种 SKU,您可以选择 16、32 或 64 个 Graviton3E 核心。除此之外,这些实例几乎都是相同的,都支持 Amazon 的弹性块存储服务、128 GB DDR5 内存以及通过上述 EFA 实现的 200 Gb/秒网络。
据亚马逊称,这种雷同是故意的。这里的想法是,通过选择较低核心数的实例,客户可以调整每个核心的特定内存或网络带宽比率。这些实例大小对于那些运行具有限制性许可制度的软件的人来说可能也是有利的。
与云提供商较旧的基于 AMD 和 Intel 的 Hpc6 实例一样,该公司希望客户像集群中的节点一样使用这些实例,而不是单独的虚拟机。在发布的版本中,该公司描述了在其 Hpc7g 实例中分配需要“数万个核心”的工作负载,因此亚马逊似乎已准备好支持一些相当大的集群。
虽然超级计算工作负载正在慢慢转移到云端,但云实例和本地系统之间的网络带宽仍然是一个瓶颈。AWS 将 HPC7g 实例定位为“用于紧密耦合的计算和网络密集型 HPC 工作负载(例如天气预报、计算流体动力学和金融期权定价)的实例类型”。
网络密集型功能以 Nitro 卸载片上系统为中心,它是处理网络、I/O 和安全性的数据处理器或基础设施处理单元。Nitro 可以与 Nvidia 的 Bluefield 或 Google 的 Mount Evans 相媲美,后者是与 Intel 共同开发的。
Nitro 已成为 AWS 云基础设施的核心,提供适合跨分布式系统高性能的 I/O。
HPC7g VM 的实例范围从 16 核到 64 个 CPU 核不等,配备 128GB 内存、Amazon Elastic Block 存储、200Gbps EFA(Elastic Fabric Adapter)带宽和 25Gbps 网络带宽。每个实例的价格无法立即获得。
GPU 选项在 HPC7g 实例中不可用。但 AWS 的 ParallelCluster 技术允许 HPC 客户混合使用 x86 和基于 Arm 的实例。AWS 没有分享有关文件系统支持的详细信息。
一些组织已经在使用 HPC7g 实例。RIKEN 利用 HPC7g 实例构建了基于 Arm 的 Fugaku 计算机的云版本,该计算机是世界上第二快的超级计算机。
点击“阅读原文”,可参考英文原文。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3441期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者