Redian新闻
>
均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop

均价300万美元?英伟达GH200超级芯片落地9个超算中心,每秒两百亿亿次flop

公众号新闻



  新智元报道  

编辑:乔杨 庸庸
【新智元导读】英伟达正在宣传其Grace Hopper的异构计算框架正在被分布于世界各地的9台超算系统所使用,共同实现了惊人的 200 exaflops的AI计算能力。这表明英伟达正在为世界上一些更强大的人工智能系统供货,已经开始取代AMD和英特尔在高性能计算领域的地位。

英伟达用Grace Hopper的实力证明,它可以成为AI超算的首选硬件,未来将不再局限于GPU。

5月12日,英伟达宣布,全球有9台新型超级计算机正在使用Nvidia Grace Hopper超级芯片来加速科学研究和发现,从而推动高性能计算(HPC)产业转向以AI驱动。

Grace Hopper超级芯片

即将上线的这9台超算包括法国的EXA1-HE、波兰的Helios、瑞士的Alps、德国的JUPITER、美国UIUC的DeltaAI以及日本的Miyabi。

这9个系统的算力加在一起可以提供200 exaflops(即每秒两百亿亿次浮点数计算)的处理能力。

此外,英国布里斯托大学的Isambard-AI和Isambard 3,以及美国洛斯阿拉莫斯国家实验室和德克萨斯高级计算中心的系统也开始使用Grace Hopper的硬件和平台。

其中,Isambard-AI第一阶段的超级计算机HPE Cray EX2500就配备了168个GH200超级芯片,成为有史以来最高效的计算机之一。

预计剩余的5280颗芯片将于今年夏天交付给Isambard-AI系统,届时其性能将提高约32倍,从而推动数据分析、药物发现、气候研究和更多AI4Science领域的发展。

英伟达Grace Hopper超级芯片架构是第一个真正的异构加速平台,将Hopper GPU的高性能和Grace CPU的多功能性融合在单个芯片中,专为加速计算和生成式AI而打造。

GH200芯片架构示意图

该系列中的GH200芯片在AI和高性能运算方面有非常强大的能力,单个GH200芯片由一个72核Grace CPU和一个H100 GPU组成,内存容量最高可达624GB。

对于百亿亿级的高性能计算或万亿参数级别的AI模型,芯片间的传输速度几乎和芯片的计算能力一样重要,服务器集群中的每个 GPU之间需要进行高速、无缝的通信,以实现大规模加速。

英伟达的NVLink技术就是为了解决通信问题,GH200中的CPU和GPU通过NVLink C2C连接在一起,提供900GB/s带宽,是第五代PCIe带宽的7倍。

在单个服务器上,通过NVlink连接的双GH200芯片可以提供比H100高3.5倍的GPU内存容量和3倍的带宽。

然而,英伟达并没有公开GH200的价格,可以参考的是,目前H100系列官方售价约为4万美元。

英伟达进军超算

近两年来,英伟达不断在服务器和高性能计算领域布局,与AMD、英特尔等公司展开竞争。

尽管英伟达的GPU业务蒸蒸日上,已经赚得盆满钵满,几乎控制全部的AI GPU市场,但进军高性能计算也非常重要,因为给超算系统提供硬件和平台是一项规模巨大且利润丰厚的业务。

目前,世界各国都在不约而同地加大数据、基础设施等方面的投资,以建造更高效的超算系统,这些超算中心以及科技巨头都可以成为Grace Hopper硬件及其平台的潜在用户。

为此,英伟达基于Arm架构从头构建了Grace系列数据中心CPU,旨在创建高性能计算和AI超级芯片。

然而,在2月发布的HPCC基准测试中,Grace还是落后于英伟达最新的Sapphire Rapids CPU,在八项测试中仅有三项更快。

但也有文章指出,Grace在散热和成本方面存在优势,这也是构建数据中心需要考虑的关键因素。

最新一代的Grace Hopper超级芯片于去年8月推出,是世界上第一个配备HBM3e内存的处理器,容量达到141GB,旨在处理「世界上最复杂的生成式人工智能工作负载,涵盖大型语言模型、推荐系统和矢量数据库」。

英伟达CEO黄仁勋穿着他标志性的皮夹克,在世界顶级计算机图形学会议SIGGRAPH 2023的讲台上发布了这款产品。

HBM(高带宽内存)各代之间的区别主要在于传输速度而非容量。相比AMD所使用的HBM3内存,HBM3e提速约50%,将Grace Hopper中的数据传输速率从原来的4TB/s提升到5TB/s。

除了Grace Hopper系列,英伟达也在雄心勃勃地扩展更多的产品线,以满足不同层次、不同场景的计算需求。

比如老黄在今年3月的GTC大会上展示的下一代Blackwell系列芯片属于英伟达,其中的GB200型号结合了一个Grace CPU和两个B200 GPU,实现5 petaflops(每秒千万亿次浮点计算)的处理能力,相比之下,H200 GPU的原始计算能力只有1 petaflops。

《巴伦周刊》分析师Tae Kim在推特中写道,据汇丰银行分析师估算,一颗GB200芯片的成本可能高达7万美元,而且英伟达更倾向于为客户提供集成了多个芯片的服务器,而不是直接出售芯片,会进一步抬高芯片的平均价格。

比如GB200 NVL36服务器配备36个GB200芯片,平均售价约为180万美元,搭载72个芯片的NVL72服务器售价可能达到300万美元。

加速AI驱动的科学研究

英伟达对基于Grace Hopper的超算中心寄予厚望,认为此举将加速科学研究进程。

高性能计算 (HPC)是推动科学计算进步的最重要工具之一,从天气预报、能源勘探到计算流体动力学和生命科学,研究人员正在将传统的模拟方法与人工智能、机器学习、大数据分析和边缘计算相融合,以解决重要的科学问题。

高性能计算用于气象建模

英伟达超大规模和高性能计算副总裁Ian Buck在一份声明中表示「人工智能正在加速对气候变化的研究、加快药物发现,并在数十个其他领域取得突破」,「Nvidia Grace Hopper正成为高性能计算的重要组成部分,因为它们能够在提高能源利用效率的同时改造整个行业。」

参考资料:
https://www.tomshardware.com/tech-industry/supercomputers/nvidia-announces-supercomputers-based-on-its-grace-hopper-platform-200-exaflops-for-ai
https://www.extremetech.com/computing/nvidia-gh200-superchip-is-now-powering-9-supercomputers

https://nvidianews.nvidia.com/news/nvidia-grace-hopper-ignites-new-era-of-ai-supercomputing




微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
损失达6000万美元?台积电回应:晶圆厂设备复原率超七成!英伟达也发声......寄居蟹的家 (Hermit Crabs' Home)xAI 和 Oracle 间 100 亿美元的生意谈崩了!有钱也租不到芯片的马斯克要自建超级计算中心,就不信“钞”能力还会失效?AI芯片里程碑,每秒1000个token美股基本面 - 2024_03_23 * 晨报 * 51Talk去年净亏损缩窄至1400万美元,预计今年一季度净收入增逾四成。业界首次!搭载英伟达GPU,50倍性能提升!Zilliz发布Milvus 2.4向量数据库清明美股风格真轮换了?英伟达一夜蒸发超2000亿美元年费 12 万美元?在线赌场因 Cloudflare 涨价被迫停运RAG微调Llama 3竟超越GPT-4!英伟达GaTech华人学者提出RankRAG框架AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训《老无所依》深度赏析五:真枪实弹 人类无效沟通实录晚点财经丨TikTok 在美国打了两百多万美元电视广告;农夫山泉净利润首次超百亿元;行为经济学奠基人丹尼尔·卡尼曼去世英伟达交付OpenAI全球首块H200;月之暗面否认创始人套现数千万美元;苹果发布设备端开源AI模型|AIGC周观察第四十一期领航与挑战,英伟达GTC怎么看?描写江南最好的诗词为AI“降温”:直接对芯片的无水液冷技术大幅降低能耗和成本,正适配英伟达GPUInfiniBand网络、HDR和IB在超算中的应用实践热归热,Groq离取代英伟达GPU有多远?AI行业买英伟达GPU,花的钱比赚的多17倍超算互联网联合体:2024超算互联网白皮书英伟达GTC解读,看懂未来3年AI格局!|预告申请吸引力增强?英伟达和佐治亚理工学院推出「AI超级计算机中心」,真“遥遥领先”了!挑战英伟达,AMD官宣年更芯片!新款MI325X重磅发布,比H200快1.3倍离贝尔维尤市中心最近的独栋新盘小区,每栋均价超550万依然提前售罄!5分钟步行到市中心马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o1个芯片顶英伟达3个?这个偏爱印度的创始人爆肝8年,终于等来抢英伟达泼天富贵的一天!英伟达GPU:AI超大规模组网微软、OpenAI欲砸千亿美元打造AI超算,挑战“英伟达霸权”?老黄将世界上第一台英伟达H200亲手交付给OpenAI每秒800个token,这颗AI芯片挑战英伟达突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?关于未来,英伟达GTC24告诉了人们什么?每秒执行超40万亿次运算!微软推出内置GPT-4o的全新AI PC“硬刚”,苹果将会如何应对?PC市场是否将迎来换机潮?【行业日报】 美国向Absolics提供7500万美元芯片经费!英伟达股票日涨9%!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。