Redian新闻
>
现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了

现场直击GTC|最科幻发布会,性能翻30倍的恐怖Blackwell芯片,黄仁勋宣告“新工业革命”来了

科技
2024年3月18日的GTC上,黄仁勋正式成了新的乔布斯。
当天下午黄仁勋走上台开始演讲,而这次与以往都不同。这场发布会在SAP中心进行,人们在百米长的队伍里要经过两个小时地检票和等待,里外里转好几道弯,才进到演讲会场。这里是硅谷很多演唱会和演出的举办地,占地4.2万平方米,曾举办过滚石和Bon Jovi 演唱会、美国NHL全明星赛,而现在站在舞台中央的是黄仁勋,他让现场的许多开发者想到了乔布斯。
在一段预热片后,黄仁勋上台。背景停留在“我是AI”的界面。
“希望大家意识到这不是一场演唱会。你来到的是个开发者大会。”黄仁勋说。这是一场只有模拟而没有动画的发布会。他说。这也让后来整场发布会越来越像科幻片。可能是人类历史上最科幻的一场发布会。
“今天抵达GTC现场的公司们价值1 trillion。这么多伙伴,需要这么多的算力,怎么办?我们需要大得多的GPU。把所有GPU 连接起来,成千上万个大的GPU里是成千上万小的GPU, 百万个GPU让你的效率提升!”
然后他简单回顾了一下AI的发展历史,“20年前我们就看到了它会到来”。
“然后CUDA和AI做了第一次亲密接触。”他说。“06年推出CUDA的时候,我们以为这是革命性的,会一夜成功,结果一等就等了二十年!”
“今天的一切都是homemade。”在一个个通过AI模拟出来的酷炫的视频后,一切铺垫就绪了——英伟达就是这一切进步的基石。是时候该发布重要芯片了。
人们对此有预期,但当B200出现的时候,现场(可能包括全世界围观者)都还是忍不住惊呼。
这是Hooper后的新一代架构,以数学家Blackwell命名。在性能上,它就是黄仁勋“黄氏定律”的集大成者和奠基者。
以下是我用AI总结的Blackwell GPU的性能特点:
  1. 高AI性能:B200 GPU提供高达20 petaflops的FP4计算能力,这是由其2080亿个晶体管提供的。
  2. 高效推理:当与Grace CPU结合形成GB200超级芯片时,它能在LLM推理工作负载上提供比单个GPU高出30倍的性能,同时在成本和能源消耗上比H100 GPU高出25倍。
  3. 训练能力:使用Blackwell GPU,训练一个1.8万亿参数的模型所需的GPU数量从8000个减少到2000个,同时电力消耗从15兆瓦降低到仅四兆瓦。
  1. GPT-3性能:在GPT-3 LLM基准测试中,GB200的性能是H100的七倍,训练速度提高了4倍。

  2. 改进的Transformer引擎:第二代Transformer引擎通过使用每个神经元的四位而不是八位,实现了计算、带宽和模型大小的翻倍。

  3. 下一代NVLink开关:允许多达576个GPU之间进行通信,提供每秒1.8太比特的双向带宽。

  4. 新的网络交换芯片:拥有500亿晶体管和3.6 teraflops的FP8计算能力,用于支持大规模GPU集群的通信。

  5. 扩展性:Nvidia的系统可以扩展到数万个GB200超级芯片,通过800Gbps的Quantum-X800 InfiniBand或Spectrum-X800以太网连接。

  1. 大规模部署:GB200 NVL72设计可以将36个CPU和72个GPU集成到一个液冷机架中,提供总共720 petaflops的AI训练性能或1.4 exaflops的推理性能。

  2. 支持大型模型:单个NVL72机架可以支持高达27万亿参数的模型,而且有意思的是,黄仁勋似乎透露了一下GPT-4的参数,它可能是一个约1.7万亿参数的模型。

(更多关于B200的解读我们会在今天稍晚带来,欢迎关注硅星人GTC后续报道)
黄仁勋回顾了自己送给OpenAI的第一个DGX,它只有0.17Peataflops,而今天的DGX Grace-Blackwell GB200已经超过1 Exaflop的算力。
老黄站在这张图前讲了半天,这画面让你觉得摩尔定律可能真的死了,黄氏定律正式登基。
在B200的发布后,黄仁勋用一个AI生成的模拟短片介绍了“配套”的一系列产品,从集群到数据中心的交换机等。基本都是性能怪兽。
GB200超级芯片就是将两个B200 GPU与一个Grace CPU结合在一起,它能将成本和能源消耗比 H100降低多达25倍”。黄仁勋表示自己可得拿稳了,“这块很贵,可能100亿?不过以后会便宜的。”现场爆笑。
与此同时,他也强调了新一代芯片和相关产品在能耗上的改进。之前训练一个1.8万亿参数的模型需要使用8000个Hopper GPU和15兆瓦的电力。如今,使用2000个Blackwell GPU就可以完成相同的任务,同时仅消耗4兆瓦的电力。
黄仁勋说,英伟达还正在将它们打包成更大的设计,比如GB200 NVL72,把36个CPU和72个GPU集成到一个单一的液冷机架中,提供总共720 petaflops 的AI训练性能或1440petaflops的推理性能。它内部有近乎两英里的电缆,包括5000条独立电缆。
此外他也特意强调了推理性能的提升,毕竟英伟达最新的财报已经显示,它的收入越来越多的来自客户们在AI推理部分的支出。主要的云厂商也都被点名表扬了一下,他们和英伟达越来越不可分离。
软件方面, 黄仁勋介绍到,英伟达正在打包预训练模型及其附属延伸,并简化了称为NVIDIA推理微服务(NIMS)的微服务部署。这不仅仅是之前的CUDA,而是让模型更易于实施和管理的平台。
“你现在就可以下载,带走,安装在你自己的数据中心”,他说道。
并且NVIDIA提供服务帮助企业和应用程序对模型进行微调或定制。
在罗列了一系列在气象和科学上的合作后,黄仁勋开始进入关于机器人技术的部分,这场发布会开始变得更加科幻。
黄仁勋说,英伟达正在押注的下一代产品是能够控制人形机器人。Jetson Thor 就是接替NVIDIA Jetson Orin,为机器人技术推出的更新产品。
“确实,世界是为人类设计的,所以我们希望使用英伟达Thor芯片和GR00T软件来训练和管理新一代的人形机器人。这样的机器人将能更好地适应人类设计的环境和工作流程,从而在多样的任务和场景中提供帮助。”
机器人展示视频过后,舞台灯光再次亮起时,黄仁勋与身后所有由公司提供动力的人形机器人站在一起,向观众致意。不知为什么有种钢铁侠的意思~
还领上来两个在NVIDIA Isaac SIM中学会走路的迪士尼小型机器人。黄仁勋说话时它们一直扭扭捏捏,让老黄不得不低头怜爱地低声说:“Orange(小机器人的名字),我在努力专心!不要再拖延时间了”——超级可爱,把现场气氛推向高潮。
而在黄仁勋和这两个小机器人一起“打开”的谢幕视频里,一架微型小飞船飞过英伟达历代GPU产品、架构,在光缆中完成了技术巡礼,最后飞机舱门不经意的打开,驾驶员正是黄仁勋的卡通虚拟数字人。
主题演讲结束前,黄仁勋又总结了一遍今天的发布会,而近距离镜头可以看到,黄仁勋似乎有些带着泪光。
“如果你问我,心目中的GPU是什么样子,今天的发布就是我的答案。”
他说今天他展示了什么是英伟达的灵魂。“我们站在计算科学和物理等其他一切科学的交叉点”。这是他心里英伟达的定位。
“新的工业革命来了。”而他没说的,是藏在今天一堆PPT里某一张的那行小字——英伟达,新工业革命的引擎。
这是黄仁勋的时代了。

❗️硅星人|AI hacker house系列活动❗️
🤖「AI人格体搭建赛 」首站来袭!
扫描下方二维码报名参赛,丰厚现金大奖等你来拿!
点个在看,再走吧👀

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
推理性能提升30倍!英伟达发布史上最强AI芯片,黄仁勋:将成最成功产品黄仁勋甩出最强AI核弹!GPU新架构性能暴涨30倍,首发人形机器人大模型,联手苹果闯MR这些宣告“跨界储能”的企业,没能跨进2024年第四次工业革命悄然揭开序幕童年故事(35):小镇钟表匠1.58万字!2024 GTC黄仁勋完整版演讲全文+视频来了!万字全文!英伟达投资交流会:机器人的ChatGPT时刻指日可待,Blackwell不只是芯片还是系统负笈不敌温柔乡(1)最强开源大模型Llama 3来了!4000亿参数狙击GPT-4,训练数据达Llama 2七倍英文作者会描述一个景物叙事的双重比喻投资核心资产“新工具”来了!易方达、银华、嘉实、华泰柏瑞等10家基金“拔头筹”打造比英伟达 Blackwell更强的GPU重磅 | 加拿大多个移民项目突然“翻脸”!多大对留学生正式“限额”!特鲁多移民政策宣告“失败”?今早,黄仁勋宣布:最强AI芯片来了现场采访黄仁勋:20个灵魂问题,谈GPU定价和中国出口,怼AGI时间表日本第一核电站发生大事故,黄仁勋当选美国工程院院士,阿里云盘宣布将限制容量溢出账户,张楠辞任抖音CEO,这就是今天的其他大新闻!关于中国业务,黄仁勋拒绝回答消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存,B200 配 288GB 显存深夜炸场!英伟达发布全球最强 AI 芯片,性能暴涨 30 倍,老黄才是这个时代的乔布斯黄仁勋,如何成为 AI 届的「明星」| 现场写小说,还是回忆录?黄仁勋2024GTC演讲实录详解最强AI芯片架构:英伟达Blackwell GPU究竟牛在哪?现场对话技术高管现场围观 | 黄仁勋对话Transformer论文作者:世界该给Tranformer翻篇了奥特曼VS黄仁勋,解决AI芯片缺口的关键点之争英伟达新架构以他名字致敬,天才数学家David Blackwell 是谁?英伟达AI大杀器!性能爆涨30倍,机器人、自动驾驶革命来临,比亚迪:我全都要!首个AI游戏引擎或颠覆任天堂/暴雪?0代码即可创建,黄仁勋预测5-10年游戏完全由AI生成比GTC2024更精彩,黄仁勋现场问答万字纪要(建议收藏)华为攻势凶猛,黄仁勋来华抚客昨天,黄仁勋举办了一场“AI春晚”GTC 对话黄仁勋:我眼中的 GPU,和别人有很大差别黄仁勋、英伟达、GTC、机器人,给我带来的几个震撼……不明白播客:大选前夜体验台湾民主的细节GTC2024黄仁勋2万字演讲全文:不止计算革命和Blackwell,新软件、AI代工厂、AI机器人皆在路上!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。