Redian新闻
>
深夜炸场!英伟达发布全球最强 AI 芯片,性能暴涨 30 倍,老黄才是这个时代的乔布斯

深夜炸场!英伟达发布全球最强 AI 芯片,性能暴涨 30 倍,老黄才是这个时代的乔布斯

公众号新闻

刚刚,英伟达发布了全球最强的 AI 芯片。
生成式 AI 已经达到了引爆点。
两个小时的 GTC 2024 大会,更像一场大型演唱会,英伟达高级科学家 Jim Fan 调侃「黄仁勋是新的泰勒·斯威夫特」。
目前英伟达黄仁勋在 AI 行业的地位,大抵就是如此。
去年黄仁勋喊出 AI 的「iPhone 时刻」已经到来,让我们看到了日常生活如何被 AI 改写,而今天则展示了这个改变的速度正被疯狂加快。
在过去 10 年里,英伟达将 AI 推进了大约一百万倍,远超摩尔定律,或者说英伟达正在书写自己的迭代定律。从芯片算力到 AI 落地,从汽车制造到医疗物流,英伟达在自身进步的同时,也推动了各行各业发展。
摩尔定律已死,可英伟达让新的摩尔定律诞生了。
除了电脑显卡,英伟达在平时很少会被我们感知,但身边许多产品的技术进步又总离不开它们,看完这篇 GTC 2024 的首发总结,或许你能对 AIGC 的浪潮有更明显的感知
昨晚 OpenAI CEO Sam Altman 在 X 发的一条推文或许正是时代的注脚:
This is the most interesting year in human history, except for all future years
这是人类历史上最有趣的一年,但会是未来最无趣的一年。
全球最强 AI 芯片诞生,性能火箭跃升
这是当今世界上生产中最先进的 GPU。
发布会的主角,是「Blackwell B200」AI 芯片,黄仁勋称这颗芯片的名字来自数学家、博弈论家、概率论家 David Blackwell。
基于台积电的 4NP 工艺,Blackwell 架构下的计算芯片拥有 1040 亿个晶体管,比起上一代 GH100 GPU 上的 800 亿个晶体管,实现了又一次突破。
Blackwell B200 并不是传统意义上的单一 GPU,它由两个 Blackwell GPU + 一个 Grace CPU 芯片组合而成,并通过 10 TB/s NV-HBI(Nvidia 高带宽接口)连接,以确保每一颗芯片能够单独运行。
因此,B200 实际上拥有 2080 亿个晶体管,能够提供高达 20 petaflops 的 FP4 算力,其中的两个 GPU 与单个 Grace CPU 相结合的 GB200,可以为 LLM(大语言模型)的推理提升 30 倍的工作效率。
GB200 的性能也将大幅提升,在具有 1750 亿个参数的 GPT-3 LLM 基准测试中,GB200 的性能是 H100 的 7 倍,而它的训练速度是 H100 的 4 倍。
更重要的是,与 H100 相比,它可将成本和能耗降低 25 倍。
此前,英伟达的 AI 处理器 H100 尽管十分畅销,然而每块 H100 的峰值功耗高达 700 瓦,超过了普通美国家庭的平均功耗,专家预测,随着大量 H100 被部署,其总功耗将与一座美国大城市不相上下,甚至超过一些欧洲小国。
黄仁勋说,训练一个 1.8 万亿参数模型之前需要 8000 个 Hopper GPU 和 15 兆瓦的功率,如今 2000 个 Blackwell GPU 就可以做到这一点,而功耗仅为 4 兆瓦。
Blackwell B200 GPU 的彪悍性能,从能耗方面也能完美体现。采用了最新 NVLink 互联技术的 B200,支持相同的 8GPU 架构和 400GbE 网络交换机,在性能大幅提升的同时,可以做到与上一代 H100/H200 相同的峰值能耗(700W)。
另外一点值得注意的是 FP4 算力。黄仁勋表示在过去的 8 年里,AI 算力提升了一千倍,其中最为关键的改进是第二代 Transformer 引擎,通过 FP4 算力使计算、带宽和模型大小得到了显著提升。
相较于 AI 常用的 FP8 算力,B200 的 2 个计算芯片让其性能达到了 H100 的 2.5 倍,每个 Blackwell 架构下的芯片算力要比上代 Hopper 芯片高出了 25%。
英伟达高级科学家 Jim Fan 称全新的 Blackwell B200 GPU 是「新的性能野兽。」
B200 在单个架构内的计算能力超过 1 Exaflop,黄仁勋交付给 OpenAI 的第一台 DGX 性能是 0.17 Petaflops,GPT-4-1.8T 参数可以在 2000 台 Blackwell 上 90 天内完成训练。
毫不夸张地说,新的摩尔定律诞生了。
由于 Blackwell 有多种不同的变体可用,因此英伟达还提供了完整服务器节点的规格,主要有三个选项。
首先是最大、最强的 GB200 NVL72 系统,配置了 18 个 1U 服务器,每个服务器配置两个 GB200 超级芯片。该系统内提供了 72 片 B200 GPU,具有 1440Peta FLOPSde FP4 AI 推理性能,和 720 Peta FLOPS 的 FP8 AI 训练性能,并将采取液冷方案,一台 NVL72 可处理 27 万亿个参数模型(GPT-4 的最大参数不超过 1.7 万亿参数)。
另外一个规格是 HGX B200,它基于在单个服务器节点中使用八个 B200 GPU 和一个 x86 CPU,每个 B200 GPU 可配置高达 1000W,并且 GPU 提供高达 18 petaflops 的 FP4 吞吐量,比 GB200 中的 GPU 慢 10%。
最后,英伟达还将推出 HGX B100,其大致规格与 HGX B200 相同,配备 x86 CPU 和 8 个 B100 GPU,只不过会与现有 HGX H100 基础设施直接兼容,并允许最快速地部署 Blackwell GPU,每个 GPU 的 TDP 限制为 700W。
在此之前,英伟达通过 H100、H200 等 AI 芯片使其成为了一家价值数万亿美元的公司,并超越了亚马逊等头部公司,而今天发布的全新 Blackwell B200 GPU 和 GB200「超级芯片」很有可能会扩大其领先地位,甚至有望超越苹果。
软件定义一切的时代正在到来
2012 年,一小群研究人员发布了一个名为 AlexNet 的突破性图像识别系统,当时它在猫狗分类任务上的表现远超过了以往的方法,这使得它成为了深度学习和卷积神经网络(CNN)在图像识别领域潜力的一个标志性证明。
也正是借此看到 AI 的机遇后,黄仁勋决定全力押注 AI。有趣的是,以前是识别生成的图片到生成文字,而现在却是通过文字来生成图片。
那么当生成式 AI 浪潮到来,我们能利用它做些什么呢?黄仁勋给出了一些标准答案。
传统的天气模型结合英伟达的气象模型 Cordiff,能够实现探索数百公里甚至数千公里面积范围的预报,提供诸如台风影响的侵袭范围,从而最大程度降低财产的损失。未来 Cordiff 也将向更多国家和地区开放。
生成式 AI 不仅可以通过数字化能力理解图像和音频,同理,也能凭借庞大的计算力扫描数十亿种化合物,从而筛选出新药。
作为一家 AI 军火商,黄仁勋还介绍了专门辅助开发 AI 芯片的 NiMS 系统。在未来,你甚至有机会组建一个 AI 超级团队,将任务拆解为一连串子任务后,就能让不同的 AI 完成检索、优化软件等任务。
未来的设施、仓库、工厂建筑将由软件定义。
无论是人形机器人、自动驾驶的汽车、操纵手臂,这些自主机器人都需要软件层面的操作系统。例如,通过 AI 与 Omniverse 的结合,英伟达打造了一个占地 10 万平米的机器人仓库。
在这个物理精确的模拟环境中,100 个安装在天花板上的摄像机使用英伟达 Metropolis 软件和自动移动机器人(AMR )的路线规划功能,实时映射了仓库的所有活动。
这些模拟还包括对 AI 代理的软件循环测试,以评估和优化系统对现实世界不可预测性的适应能力。
在模拟的一个场景中,AMR 在前往取货盘的途中遇到了一起事故,阻碍了其预定路线。Nvidia Metropolis 随即便能更新并发送了实时占用地图给控制系统,后者计算出了新的最优路径。
仓库操作员还可以通过自然语言向视觉模型提问,模型能够理解细节和活动,并提供即时反馈以改善运营效率。
值得一提的是,本次发布会还出现了苹果 Vision Pro 的身影。企业可以轻松地通过 Omniverse Cloud 将 3D 应用的交互式通用场景描述(OpenUSD)实时串流到 Vision Pro,帮助用户探索前所未有的虚拟世界。
发布会的结尾则是熟悉的机器人环节,正如黄仁勋所说,当他张开双手,与其他人形机器人站在一起的那一刻,此时「计算机图形学,物理学,人工智能的交叉点,这一切都在这一刻开始」。
小彩蛋
十年前 GTC,黄仁勋首次强调机器学习的重要性,在许多人还在把英伟达当作「游戏显卡」的制造商时,它们已经走在了 AI 变革的最前沿。
在被称为 AI 应用元年的 2024,英伟达早就用 AI 软硬件在众多领域为各行各业赋能:大语言模型、对话式 AI、边缘计算、大数据、自动驾驶、仿生机器人......
药物发现不是我们的专长,计算才是;制造汽车不是我们的专长,造汽车所需要的 AI 计算机才是。

坦率地说,一家公司很难擅长所有这些事情,但我们非常擅长其中的人工智能计算部分。
相较于单一行业的佼佼者,英伟达更像是一个「幕后大佬」,只要谈到 AI,英伟达一定是绕不开的话题。
就像老黄说的,英伟达已然是一家平台公司。
正是当年的超前部署、历史发展的大势所趋,让英伟达能在 AI 时代的开端,能够占据 AI 芯片市场 70% 以上的销售额,公司估值也在不久前超过 2 万亿美元。
或许这也是苹果纠结多年后放弃造车、并大力投入生成式 AI 的理由,无论是经济效益还是技术趋势,都太值得豪赌一把了。
在我们还在质疑「AI」有什么用的当下,英伟达用行动证明,AI 已经成为了新时代不可或缺的一部分。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
黄仁勋甩出最强AI核弹!GPU新架构性能暴涨30倍,首发人形机器人大模型,联手苹果闯MR英伟达抛出年度AI杀器:史上最强芯片,还有机器人大模型英伟达发布「AI 核弹」/苹果谈判 iPhone 引入 Gemini/东方甄选否认使用违规槽头肉英伟达发布新一代 GPU 架构;盒马 CEO 侯毅退休;苹果希望将谷歌 Gemini 引入 iPhone | 极客早知道18万元史上最高价名片,是乔布斯签名的这一张推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品苹果考虑在 iPhone 上引入 Gemini/英伟达发布「AI 核弹」/华为第一季度折叠屏份额或超越三星不明白播客:大选前夜体验台湾民主的细节现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了Meta加速抛弃英伟达?今年将部署自研推理芯片,训练芯片也在路上英伟达卷疯了!最强芯片炸裂AI界,老黄还拿出机器人大模型华为 Pura 70 系列上架即售罄/Meta 发布全球最强开源大模型/理想汽车 L6 发布写小说,还是回忆录?苹果发布最强 iPad Pro!首发 M4 芯片,性能吊打 AI PC,还是史上最薄苹果产品老黄炸场!深夜发布全球最强芯片B200!推理速度提升30倍别的简报|敢和自己朋友谈恋爱的人才是这个时代的勇者重磅!英伟达发布全球最强 AI 芯片,人形机器人也来了苹果最贵最强iPad发布!首发M4芯片,AI性能提升60倍,满配售价近3万!全球33国认证「防晒口罩」!UPF超国标35倍,性能吊打国内外大牌OpenAI深夜炸场,GPT-4o干翻所有语音助手!麦当劳回应使用过期食材:深表歉意;璩静离职后发声丨邦早报英文作者会描述一个景物叙事的双重比喻未央播报 | 消费金融新规发布 英伟达发布旗舰AI芯片童年故事(35):小镇钟表匠重磅!英伟达官宣全球最强AI芯片:性能提升 30 倍,并将重新设计整个底层软件堆栈英伟达发布新的机器人制造平台;亿航智能“空中的士”上架淘宝丨智能制造日报最强开源大模型深夜炸场! Llama 3 王者归来,直逼 GPT-4, 马斯克点赞 | 附体验链接GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了负笈不敌温柔乡(1)英伟达AI大杀器!性能爆涨30倍,机器人、自动驾驶革命来临,比亚迪:我全都要!英伟达股价又创下历史新高!扎克伯格宣布购买35万GPU芯片,芯片的巨大潜力增长GPT-4绝对性能暴涨74.4%!UIUC苹果华人团队提出CodeAct,用Python代码统一LLM智能体行动重磅!英伟达官宣全球最强 AI 芯片:性能提升 30 倍,并将重新设计整个底层软件堆栈英伟达市值飙升1.8万亿美元,赶超谷歌、亚马逊!老黄:我才刚上路呢大象坐上火箭,英伟达发布财报后股价再次大涨炸裂!英伟达发布全球最强AI芯片:性能提升30倍;盒马CEO侯毅退休;许家印拟被终身禁入证券市场;三只羊回应梅菜扣肉事件丨邦早报
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。