Redian新闻
>
英伟达H100用11分钟训完GPT-3!PyTorch创始人:不要只看时间

英伟达H100用11分钟训完GPT-3!PyTorch创始人:不要只看时间

公众号新闻

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【目标检测和Transformer】交流群

转载自:机器之心 | 编辑:杜伟

赢了,但没有全赢。

昨天,老黄又「赢麻了」!
为啥呢?原来在最新的 MLPerf 基准测试中,英伟达 H100 GPU 芯片组在以下八项基准测试中全部创下了新纪录,同时成为唯一一个跑完所有测试的硬件平台。
据悉,最新 MLPerf Training v3.0 包含了基于 GPT-3 175B 的大型语言模型(LLM)测试,侧重于生成式 AI 能力。
图源:MLPerf benchmarks。
LLM 训练测试中还使用了专注于 GPU 加速的云计算服务提供商 CoreWeave 提供的 NVIDIA HGX H100 基础设施,在多个规模上联合提交了 LLM 工作负载。
出来的结果令人振奋:在 896 个英特尔 Xeon Platinum 8462Y 和 3584 个英伟达 H100 芯片的合作下,仅仅用了 11 分钟就完成了基于 GPT-3 的 LLM 训练任务。
一时之间,AI 社区响起了老黄赢麻了的欢呼声。
可结果真如此吗?今天有人对此事提出了质疑。
先是 PyTorch 创始人 Soumith Chintala,他认为 GPT-3 并没有在 11 分钟内训练完成。使用 3584 个 H100 GPU,GPT-3 架构在 C4 数据集上训练了 11 分钟,对数概率为 2.69。
这里不要只关注「11 分钟」,因为这就像说「ResNet-50 在 MNIST(其实这里他想说的是 CIFAR100)上,5 秒内训练达到了 80%的准确率。」
推特用户 @abhi_venigalla 对 Soumith 的观点表示赞同,他是生成式 AI 创业公司 MosaicML 的研究者。他认为 MLPerf 基准测试中训练 GPT-3 的时间更可能是 2 天。
在他看来,该基准测试并不是完整的 GPT-3。MLPerf 的 LLM 基准只提供了一个开始的检查点,然后必须达到目标损失。
因此,该基准 11 分钟跑完 GPT-3 只覆盖 1.2B 的 token,而非完整的 300B token。此外看起来更像是 540 TFLOPs/H100,从配置上看像 FP8,~27% MFU。
不过他也承认,从 H100 在其软件生命周期早期这一点来看,以此规模实现现在这种性能也相当惊人。
所以,最新 MLPerf 基准测试中 11 分钟训完 GPT-3 是不是被误解呢?评论区的小伙伴也可以发表下自己的观点。
参考链接:https://developer.nvidia.com/blog/breaking-mlperf-training-records-with-nvidia-h100-gpus/

点击进入—>【目标检测和Transformer】交流群


最新CVPR 2023论文和代码下载


后台回复:CVPR2023,即可下载CVPR 2023论文和代码开源的论文合集

后台回复:Transformer综述,即可下载最新的3篇Transformer综述PDF


目标检测和Transformer交流群成立


扫描下方二维码,或者添加微信:CVer333,即可添加CVer小助手微信,便可申请加入CVer-目标检测或者Transformer 微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer等。


一定要备注:研究方向+地点+学校/公司+昵称(如目标检测或者ransformer+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群


▲扫码或加微信号: CVer333,进交流群


CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉,已汇集数千人!


扫码进星球


▲点击上方卡片,关注CVer公众号

整理不易,请点赞和在看

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
LPython:最新的高性能 Python 实现、速度极快且支持多后端追剧 《听说你喜欢我》老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了英伟达H100供给缺口:43万张!Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用:分析数据、生成代码都精通大大是条大灰狼苏妈战老黄!官宣AMD大模型专用卡,对标英伟达H100,可跑更大模型英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试,集群性能逼近线性增长详解Python文件: .py、.ipynb、.pyi、.pyc、​.pyd !GPT-4参数最新爆料!1.76万亿参数,8个2200亿MoE模型,PyTorch创始人深信不疑9.1住|接本科生|近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟studio 2500+,包供暖和热水9.1入住|接本科生 |近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟1B1B 2800,包供暖和热水Python 吞噬世界,GPT 吞噬 Python!ChatGPT 上线最强应用比 Python 快 3.5 万倍的 Mojo 融资七亿,LLVM之父:不会威胁到 Python,该恐惧的应该是 C++英伟达H100将在2024年之前售罄!推理GPU根本不够用,AI初创公司急了年度最绝融资:拿英伟达H100抵押贷款165亿,买更多英伟达GPU扩建10个数据中心买住房保险有门道 不要只看价钱一斤黄金和一斤英伟达H100,谁贵?两首合唱:《赤伶》&《是否》柳士同诗稿英伟达H100所获利润高达1000%!亚太将主导全球汽车传感器;微软Meta均在挑战OpenAI地位 | AIoT情报核磁共振仪价格暴跌10倍,只因国产取得突破,欧美的好日子到头了老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了。。。AMD的千亿晶体管芯片,叫板英伟达H100Python吞噬世界,GPT吞噬Python!ChatGPT 上线最强应用:分析数据、生成代码都精通2.2万张H100造全球最大超算,ChatGPT劲敌融资13亿美元!微软英伟达领投,Inflection一年撼动OpenAI霸权GPT-5出世,需5万张H100!全球H100总需求43万张, 英伟达GPU陷短缺风暴挑战英伟达H100霸权!IBM模拟人脑造神经网络芯片,效率提升14倍,破解AI模型耗电难题LPython:最新的高性能Python实现、速度极快且支持多后端笑果被罚款1335万,无限期暂停在京演出;药明康德联合创始人赵宁去世;ChatGPT创始人呼吁加强对AI监管丨邦早报9.1住|接本科生|室内洗烘|近伯克利步行1分钟/NEU步行11分钟/BU步行15分钟两室一厅两卫5000,包供暖和热水英伟达H100的唯一替代芯片?MLPerf认证!代工一颗英伟达H100,台积电挣1000美金用22000个英伟达H100入局AI,初创企业的豪赌英伟达H100霸榜权威AI性能测试,11分钟搞定基于GPT-3的大模型训练
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。