Redian新闻
>
英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试,集群性能逼近线性增长

英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试,集群性能逼近线性增长

公众号新闻
明敏 发自 凹非寺
量子位 | 公众号 QbitAI

11分钟内训练一遍GPT-3,8秒训完BERT

这就是英伟达给AI圈的一点“小小震撼”。

在最新MLPerf训练基准测试中,英伟达H100集群,横扫八项测试,全部创下新纪录,并且在大语言模型任务中表现尤为突出!

在大语言模型任务中,H100集群的加速性能逼近线性增长

即随着集群处理器数量增加,加速效果也几乎同比增加。

这意味着在集群内GPU之间的通信效率非常高。

除此之外,H100还完成了推荐算法、CV、医学图像识别以及语音识别等任务,是唯一一个参加8项测试的集群。

而在算力就是生产力的时代下,这波成绩意味着什么,懂得都懂。

据悉,本次测试系统由英伟达和Inflection AI联合开发,在云厂商CoreWeave上托管。

单节点性能增长明显

这次MLPerf Training v3.0中增加了两项新任务:

  • 大语言模型(基于GPT-3)

  • 推荐算法

这意味着测试任务包含了更大的数据集和更先进的模型。

如上刷新各项记录的,是由3584块H100组成的超大集群。

它的具体成绩如下:

这是本轮测试中,英伟达拿出的最大集群。

实际上他们还提交了一个包含768块H100的集群进行测试,并分别在云上和本地部署。

结果显示二者性能几乎完全相同。

更进一步还论证了随着集群中显卡数量的增加,其性能提升可以接近线性增长。

(NVIDIA Pre-Eos为本地部署,NVIDIA+CoreWeave为云上部署)

除此之外,这轮测试中英伟达还刷新了单节点加速记录。

和6个月前MLPef Training v2.1的数据比较,单个DGX H100系统(8块H100组成)在各项任务中平均提速17%。

和A100 Tensor Core GPU相比,最高能提速3.1倍(BERT任务)

这些加速效果的实现,主要得益于两个方面。

一方面是H100本身就足够强悍

H100基于最新Hopper架构,采用台积电4nm工艺,集成800亿个晶体管,较A100增加了260亿个。

内核数量达到前所未有的16896个,是A100的2.5倍。

由于面向AI计算,H100中专门搭载了Transformer Engine,让大模型训练速度可直接×6

另一方面则是依赖集群内的加速网络。

这里使用的是英伟达Quantum-2 InfiniBand网络,是该网络架构的第七代。

官网介绍,加速网络能够提供软件定义网络、网络内计算、性能隔离、优越加速引擎、RDMA和最快达400Gb/s的安全加速。

据悉,共有90个系统参与最新一轮测试,其中82个使用了英伟达的GPU,英特尔方面有7个系统参与。

英特尔的加速系统使用了64-96 Intel Xeon Platinum 8380处理器和256-389 Intel Habana Gaudi2加速器。

其高配系统完成LLM的训练时间为311分钟。

基于这次报告的测试结果,有分析师表示他感受到的最大震撼不是H100本身的性能,而是在云上训练AI实现的卓越效果。

那么这次和英伟达合作的云厂商CoreWeave是谁?联合开发系统Inflection AI又来者何人?

计算集群还会进一步扩大

首先来看CoreWeave

它成立于2017年,是一家大型云厂商,号称提供业内最快、最灵活的大规模GPU计算资源,提供渲染、机器学习等云上方案,速度比大型公共云快35倍,成本低80%。

而这家云厂商很受科技巨头青睐,英伟达在此之前没少cue过它。

5月,CoreWeave拿下2亿美元融资,主要来自对冲基金Magnetar Capital,B轮总融资额达到4.21亿美元。

6月,有消息称微软与CoreWeave签署AI算力协议,用于计算基础设施,未来数年内的投资金额可能数十亿美元。

英伟达也向CoreWeave投资了1亿美元,4月时它的估值为20亿美元。

另一家AI初创公司Inflection AI由DeepMind创始成员穆斯塔法·苏莱曼(Mustafa Suleyman)等人创立。

这家公司成立于22年3月,已拿下2.25亿美元融资,估值超12亿美元。

公司已经开发出了一个大语言模型Pi,正是在H100集群上训练出来的。

据了解,Pi的定位是帮助人类更好和计算机交互,它能通过聊天内容来逐渐了解用户,然后提供更加个性化的回答,类似于个人智能管家的感觉。

Inflection AI的最新Blog里表示,基于目前的合作,他们计划在未来几个月内进一步扩大底层计算基础设施的规模。

参考链接:
[1]
https://blogs.nvidia.com/blog/2023/06/27/generative-ai-debut-mlperf/?continueFlag=685ee2dc8db6455efed731baa85e2741
[2]https://developer.nvidia.com/blog/breaking-mlperf-training-records-with-nvidia-h100-gpus/
[3]https://www.forbes.com/sites/stevemcdowell/2023/06/27/nvidia-h100-dominates-new-mlperf-v30-benchmark-results/?sh=62b226c35e99

本届稀土开发者大会将在明天(6月30日)上午9:30正式开启

线上线下报名戳阅读原文链接!

两天的论坛涵盖了AIGC与大模型、研发效能与团队管理、云原生、分布式云和边缘计算、可观测性探索、架构设计与演进、音视频技术前沿、出海业务探索等分论坛,来自字节跳动、英特尔、阿里、腾讯、哈啰、快手、谷歌等公司的60位技术嘉宾将聚焦前沿技术和业务结合的最新实践,带来专业前沿的技术分享。大会全日程请继续往下翻哦~

现场设置了14个特别展区,掘金IP展区、酷炫技术、虚拟偶像A-SOUL、最新技术书籍邀你打卡,集满印章还可获得AirPods Pro、「在吗?在码!」系列最新大会周边等精美礼品,人手一份,不要错过啦!

附一个微信公众号推文地址 👉 倒计时一天!请查收这份最全的稀土开发大会参会指南


点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~ 

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
经历生后方秀惟的格少了年轻时的冲劲但多了一个份从容内心平静就犹如一滩泉水第 三 章代工一颗英伟达H100,台积电挣1000美金9.1入住|接本科生 |近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟1B1B 2800,包供暖和热水刚炮轰完GPT模式,杨立昆推出首个“世界模型”苏妈战老黄!官宣AMD大模型专用卡,对标英伟达H100,可跑更大模型9.1住|接本科生|近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟studio 2500+,包供暖和热水英伟达H100所获利润高达1000%!亚太将主导全球汽车传感器;微软Meta均在挑战OpenAI地位 | AIoT情报百度最新研究成果登Nature正刊:免疫原性增强128倍、11分钟找到最稳定序列杭州亚运会杀疯了!主题宣传片用“丝绸”绣制而成,仅1分钟要绣上千幅!网友:太惊艳了!老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了AMD的千亿晶体管芯片,叫板英伟达H100美国入境档案--居浩然,1947年旧金山一斤黄金和一斤英伟达H100,谁贵?2.2万张H100造全球最大超算,ChatGPT劲敌融资13亿美元!微软英伟达领投,Inflection一年撼动OpenAI霸权GPT-5出世,需5万张H100!全球H100总需求43万张, 英伟达GPU陷短缺风暴ChatGPT官方APP上线仅2天,霸榜了!9.1住|接本科生|近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟studio 2650,包供暖和热水美国入籍考试规则明年或更新!难度加大且新增一项测试!英语不好恐成问题!英伟达H100用11分钟训完GPT-3!PyTorch创始人:不要只看时间碾压LLaMA,「猎鹰」彻底开源!400亿参数,万亿token训练,霸榜Hugging Face9.1住|接本科生|室内洗烘|近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟两室一厅两卫5000,包供暖和热水英伟达H100供给缺口:43万张!第 四 章年度最绝融资:拿英伟达H100抵押贷款165亿,买更多英伟达GPU扩建10个数据中心老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了。。。迄今为止规模最大,至少17国超2700杀猪盘工人菲律宾获救,包括600余中国人英伟达H100将在2024年之前售罄!推理GPU根本不够用,AI初创公司急了英伟达H100的唯一替代芯片?MLPerf认证!挑战英伟达H100霸权!IBM模拟人脑造神经网络芯片,效率提升14倍,破解AI模型耗电难题英伟达H100霸榜权威AI性能测试,11分钟搞定基于GPT-3的大模型训练M2 Ultra性能测试,GPU性能仅有4080一半硬核观察 #1081 仅 100KB 大小,只需 4 分钟训练的人工智能图像生成器zt事不三思恐怕忙中有错气能一忍方知过后无忧道理服人那怕英雄是虎律条不犯甚么官法如炉用22000个英伟达H100入局AI,初创企业的豪赌
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。