Redian新闻
>
英伟达:下一代GPU细节曝光

英伟达:下一代GPU细节曝光

公众号新闻

本文转自“英伟达:下一代GPU细节曝光”。Nvidia 正在准备该公司的 GeForce RTX 50 系列 (Blackwell) 产品,以与最好的显卡相竞争。著名硬件泄密者 @kopite7kimi 声称,根据他的信息,Blackwell系列的内存接口配置不会与Ada Lovelace系列有太大差异。既然这是一个泄漏,请持保留态度。我们从之前发布的一些泄密信息中了解到 ,该公司计划在其基于Blackwell 架构 的下一代顶级 GB202 GPU 中保留 384 位内存总线 。


相关链接:

1、英伟达NVLink技术详细概述

2、英伟达Blackwell平台网络配置详解

3、英伟达GB200 NVL72全互联技术,铜缆方案或成为未来趋势?

4、英伟达Blackwell性能翻5倍,AMD/Intel产品升级,国产厂商如果应对?



更多GPU技术细节,请参考文章“最新版:GPU显卡天梯图(2023年11月)”,“全球GPU呈现“一超一强”竞争格局”,“2023年GPU显卡词条报告”,“HBM崛起:从GPU到CPU”,“英伟达GPU龙头稳固,国内逐步追赶(2023)”,“英伟达L40S GPU架构及A100、H100对比”,“AI芯片第一极:GPU性能、技术全面分析”,“主流国产GPU产品及规格概述(2023)”,“新型GPU云桌面发展白皮书”,“国内外GPU现状:海外龙头领跑,国产差距明显”,“GPGPU流式多处理器架构及原理”等等。


Nvidia 的 Blackwell 可能是该公司第一个支持GDDR7内存的系列,与现有的GDDR6和GDDR6X内存解决方案相比,其更高的数据传输速率和架构特性有望显着提高性能。鉴于第一代 GDDR7 SGRAM IC 将具有 32 GT/s 的数据传输速率,采用这些芯片的 384 位内存子系统将提供约 1,536 GB/s 的带宽,因此 512 位内存接口是不容错过的。


虽然我对512位还抱有幻想,但GB20x的内存接口配置和AD10x没有太大区别。


2024 年 3 月 9 日,美光表示 16 Gb 和 24 Gb GDDR7芯片将于 2025 年上市,但其路线图并未表明这些设备是否会同时推出,还是 16 Gb 会更早推出。也就是说,仍有待观察的是 Nvidia 是否会在其最初的 GeForce RTX 50 系列显卡中使用 16 Gb 还是 24 Gb GDDR7 内存 IC。


由于英伟达的Blackwell家族至少还有两到四分之三的时间,现在很难做出预测。然而,我们在表中概述了GB200系列供电产品的可能内存配置。


迄今为止的几代产品中,Nvidia 的顶级消费类显卡均使用 384 位内存接口(AD102、GA102),事实证明,从性能和成本的角度来看,该接口是最佳的。Nvidia 顶级消费类图形产品的精简版采用 320 位内存接口,而高端 GPU 则采用 256 位总线(例如 AD103、GA103 和 GA104)。同时,性能主流段也有采用192位内存总线的GPU(如AD104、GA106)和主流段采用128位内存接口的GPU(如AD106、AD107、GA107)。


虽然泄密者的评论表明Blackwell系列将在很大程度上保留当前Ada Lovelace系列的内存接口配置,但应该记住,根据同一泄密者,Blackwell 系列将缺少 GB204 GPU。相比之下,传闻中的GB205很可能不会直接继承 AD104。



功率突破1000W?



如果您认为 Nvidia 的 700W H100 是又热又耗电的机器,那就等到今年晚些时候 的 B100  GPU上市吧。

戴尔科技集团首席运营官杰夫·克拉克 (Jeff Clarke) 表示,Nvidia 最新的 AI 加速器的功耗将达到 1,000 瓦,比其前身高出 42%。但别担心,他非常确定驯服这头野兽不需要液体冷却。

克拉克上周在戴尔财报电话会议上对投资者表示:“我们对 H200 所发生的事情及其性能改进感到兴奋。”他补充说,他对 Nvidia 即将推出的 B100 加速器和另一个他称为 B200 的加速器也有同样的感受。。

他认为,处理每个功耗 1,000 瓦的 GPU 不需要直接液体冷却——他说“明年 B200 就会达到这一水平”。

目前还不完全清楚 Clarke 所指的“B200”卡是什么,因为去年秋天英伟达与投资者分享的路线图上没有出现该名称的芯片。然而,我们怀疑 Clarke 实际上指的是 GB200 Superchip,它与GH200一样,预计将 Nvidia 的 Grace CPU 与其 B100 GPU 结合起来。


根据我们对 GH200 中 Grace CPU 的了解,并假设功耗没有重大变化,GB200 的热设计功耗 (TDP) 约为 1,300 瓦,比其前身高出 30%。

英伟达也可能还有另一张我们还不知道的牌。这家 GPU 巨头的下一代 Blackwell 架构的细节仍然很少。

除了命名之外,克拉克表示即将推出的芯片将提供一个机会来大规模展示戴尔在其他形式的液体冷却方面的专业知识。他提到“流体化学和性能、我们的互连工作、我们正在做的遥测、我们正在做的电源管理工作”作为直接液体冷却替代方案的步骤,即使对于非常密集的芯片也是如此。

在 Nvidia 的带宽使H200 GPU 在今年上半年首次亮相后,B100 预计要到 2024 年年底才会推出。

H200 于 2023 年末发布,是 H100 的更新版,配备高达 141GB 的 HBM3e 内存,可实现高达 4.8TB/秒的带宽。Nvidia声称,由于该芯片的 HBM3e 内存堆栈,该设备可以使包括 Llama 70B 在内的大型语言模型的性能提高一倍。

分析师警告称,即使今年有两款新的加速器上市,Nvidia 的 GPU 供应仍将受到限制。尽管有报道预测 Nvidia 的 GPU 出货量可能会在 2024 年增加三倍以上。

除了新的加速器之外,Nvidia 的路线图还要求在今年年底前推出速度更快、功能更强大的 InfiniBand 和以太网 NIC 以及交换机,每个端口的带宽可达 800Gb/秒。

来源:半导体行业观察

相关阅读:

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
英伟达推「万亿参数」GPU,继续加速「AGI 时代」醉驾车祸细节曝光! 华裔女子飙车害死男伴,对美国警方瞒天过海,逃回中国细节曝光....热归热,Groq离取代英伟达GPU有多远?突破摩尔定律极限!前谷歌量子计算团队首创「热力学计算机」,英伟达GPU「退役」?7051 血壮山河之枣宜会战 宜昌溃战 7美重犯拒捕4警殉职细节曝光!从高处扫射100多发子弹,激烈枪战画面曝光(图)国产GPU重大利好!“中国英伟达”千卡集群已就位台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!一文读懂英伟达的“新GPU”:比H100快5倍?1200W的功耗?液冷?与MI300X比较又如何?上海AI Lab开源首个可替代GPT-4V的多模态大模型英伟达吞噬世界!新架构超级GPU问世,AI算力一步提升30倍消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存,B200 配 288GB 显存吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型OpenAI掌门人最新演讲内容要点:下一代AI模型更强大,不需担心超级智能要变天了!3月23日起澳洲学签改革,GST取代GTE,签证更难下了鸟巢打造比英伟达 Blackwell更强的GPU旅行的尽头是日本(25)早稻田大学,大偎重信,松尾芭蕉业界首次!搭载英伟达GPU,50倍性能提升!Zilliz发布Milvus 2.4向量数据库英伟达下一代GPU披露:集成八个HBM 4黄仁勋刚刚发布,英伟达最强GPU B200,首次采用Chiplet?吴恩达:别光盯着GPT-5,用GPT-4做个智能体可能提前达到GPT-5的效果100、长篇家庭伦理小说《嫁接》第二十七章 何去何从(上部完)OpenAI有望在今年夏季推出GPT-5;英伟达推出更强GPU芯片;马斯克宣布正式开源Grok-1|AIGC周观察第三十七期为AI“降温”:直接对芯片的无水液冷技术大幅降低能耗和成本,正适配英伟达GPU英伟达黄仁勋:下一代智能汽车芯片与三家中国车企达成合作从零开始手搓GPU!照着英伟达CUDA来,只用两个星期!AI行业买英伟达GPU,花的钱比赚的多17倍野心藏不住了!不满CPU统治,英伟达决定彻底重写软件开发栈!黄仁勋:为什么还要用Python?命令行都不需要!GPU开发时代将至英伟达发布新一代 GPU 架构;盒马 CEO 侯毅退休;苹果希望将谷歌 Gemini 引入 iPhone | 极客早知道美股基本面 - 2024_02_28 * 晨报 * 比特币势创2021年10月来最佳单月表现 减半临近或有望挑战纪录高位。“百微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行英伟达 GTC 大会携万亿参数 GPU「炸裂」 AI 行业详解最强AI芯片架构:英伟达Blackwell GPU究竟牛在哪?现场对话技术高管从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。