Redian新闻
>
英伟达H100的唯一替代芯片?MLPerf认证!

英伟达H100的唯一替代芯片?MLPerf认证!

公众号新闻

来源:内容由半导体行业观察(ID:icbank)编译自wccftech,谢谢


英特尔和 Habana 今天发布了MLPerf 训练基准,其中包含一些非常有趣的结果。英特尔的Gaudi2芯片现在是用于训练LLM的 NVIDIA GPU 的唯一替代品。NVIDIA 的股价在最近的 AI(又名 LLM)淘金热中绝对飙升,因为该公司的 GPU 被用来训练几乎所有流行的 LLM(如 ChatGPT)。


然而,Intel Gaudi2 芯片现在是 NVIDIA GPU 的唯一可行替代品,并且他们已经发布了基准测试来证明这一点。


ChatGPT 可能是世界上一段时间以来最具颠覆性的力量,很明显,LLM 是未来的方向。ChatGPT基于 GPT 3.5 模型,而 GPT 3.5 模型又基于 GPT-3 基本模型。ChatGPT 4 基于 GPT-4,但相关信息极其稀疏,并且不存在相关基准。因此,在确定使用什么作为训练 CPU/GPU 时,将 GPT-3 训练到足够的准确度(或减少损失函数)将是最相关的基准。NVIDIA 使用其 Hopper GPU 在这一领域占据主导地位,但最终还有一个替代方案:Intel Gaudi2。


英特尔声称目前在 FP16 工作负载中比 A100 具有更好的性价比,并计划在 9 月份(在 FP8 工作负载中)击败 NVIDIA 的 H100。这是一个相当雄心勃勃的目标,但该公司有基准来支持这一目标。以下是结果的快速高级概述:


  • Gaudi2 在 GPT-31 上的训练时间令人印象深刻:在 384 个加速器上花费了 311 分钟。

  • GPT-3 模型上从 256 个加速器到 384 个加速器的近线性 95% 扩展。

  • 在计算机视觉(ResNet-50 8 加速器和 Unet3D 8 加速器)以及自然语言处理模型(BERT 8 和 64 加速器)方面取得了出色的训练结果。

  • 与 11 月提交的内容相比,BERT 和 ResNet 模型的性能分别提高了 10% 和 4%,这证明了 Gaudi2 软件的成熟度不断提高。

  • Gaudi2 结果是“开箱即用”提交的,这意味着客户在本地或云端实施 Gaudi2 时可以获得可比较的性能结果。


综合考虑上述情况,NVIDIA 条目可以在 45 分钟内训练 GPT-31,而且还利用更多的 GPU。最后,进行正确比较的唯一方法是使用 TCO 并了解确切的成本和 TDP/热量限制。但所有这些可能都无关紧要,因为这个领域的需求远远超过供应。虽然 NVIDIA GPU 将热销,但它们的供应有限,而且市场将缺乏能够训练LLM的芯片——而这正是英特尔的 Gaudi2 可以挽救局面的地方。


英特尔还分享了其 Xeon Platinum 级 CPU 的结果,这些 CPU 目前用于 LLM 训练的最佳性能 MLPerf 提交,而 GPT-3 的培训时间刚刚超过 10 个小时。以下是结果亮点:


  • 在closed division,第四代 Xeon 可以在不到 50 分钟的时间内训练 BERT 和 ResNet-50 模型。(47.93 分钟)且不到 90 分钟。(88.17 分钟);

  • 在开放部门使用 BERT 时,结果表明,当扩展到 16 个节点时,Xeon 能够在大约 30 分钟(31.06 分钟)内训练模型。

  • 对于较大的 RetinaNet 模型,Xeon 能够达到 232 分钟的时间。在 16 个节点上,客户可以灵活地使用非高峰 Xeon 循环在早上、午餐时间或夜间训练他们的模型。

  • 采用英特尔高级矩阵扩展 (英特尔 AMX) 的第四代至强可提供显着的开箱即用性能改进,涵盖多个框架、端到端数据科学工具和广泛的智能解决方案生态系统。


附相关说明图片




👇👇 点击文末【阅读原文】,可查看原文链接!

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3446期内容,欢迎关注。

推荐阅读


处理器架构,如何发展?

DRAM,下一步是什么?

碳化硅“狂飙”:追赶、内卷、替代


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一斤黄金和一斤英伟达H100,谁贵?老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了。。。贾宝玉睡了林黛玉吗?GPT-5出世,需5万张H100!全球H100总需求43万张, 英伟达GPU陷短缺风暴什么是三级认证?如何在美国办理三级认证?美之信助您在全美办理公证/认证!用22000个英伟达H100入局AI,初创企业的豪赌台积电据闻开始准备为苹果、英伟达试产2nm芯片?!英伟达、云厂商们也没有H100余粮了!未来全球顶级芯片缺口达40多万张英伟达H100霸榜权威AI性能测试,11分钟搞定基于GPT-3的大模型训练Chanticleer花园,春回花开第一百零五章 还乡团英伟达并非人工智能革命的唯一大赢家英伟达正准备推出具有 94GB 和 64GB 显存的 H100 Hopper 加速卡恭喜客人成功办理美国三级认证!如何在美国办理三级认证?美之信助您在全美办理公证/认证!回国办事面面观,惊喜与失望交织英伟达H100将在2024年之前售罄!推理GPU根本不够用,AI初创公司急了时间都去哪儿了恭喜客人成功办理三级认证!如何在美国办理三级认证?美之信助您在全美办理公证/认证!英伟达H100所获利润高达1000%!亚太将主导全球汽车传感器;微软Meta均在挑战OpenAI地位 | AIoT情报Graphcore支持Byte MLPerf,为AI生产部署提供性能基准参考英伟达H100用11分钟训完GPT-3!PyTorch创始人:不要只看时间代工一颗英伟达H100,台积电挣1000美金英伟达生成式AI超级芯片GH200,两倍H100算力,黄仁勋:它会疯狂推理苏妈战老黄!官宣AMD大模型专用卡,对标英伟达H100,可跑更大模型早财经丨西安秦岭山洪已造成2死16失联;7月人民币存款减少1.12万亿元;中国公司抢购50亿美元芯片?英伟达回应​恭喜客人成功办理美国三级认证!如何在美国办理三级认证?美之信助您在全美办理公证/认证!台积电拿下英伟达下一代芯片的全部订单老黄赢麻了!英伟达H100订单排到24年,马斯克都坐不住了时序图,UML给软件开发带来的唯一好处英伟达H100杀疯了:11分钟训完GPT-3,霸榜8项测试,集群性能逼近线性增长恭喜客人成功拿到H1B签证!美移民局为何开启二轮抽签?一文深度剖析H1B签证!他宣布,竞选美国总统!事关中国,英伟达CEO警告拜登政府!抗衡微软、谷歌,马斯克要开AI公司了?Meta再裁6000人AMD的千亿晶体管芯片,叫板英伟达H100英伟达H100供给缺口:43万张!年度最绝融资:拿英伟达H100抵押贷款165亿,买更多英伟达GPU扩建10个数据中心
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。