Redian新闻
>
黄仁勋发布全新GPU,专为大模型打造,微软谷歌Meta排队预定|GGView

黄仁勋发布全新GPU,专为大模型打造,微软谷歌Meta排队预定|GGView

公众号新闻


GGV有话说:


近期,黄仁勋在台北大学毕业典礼上的演讲在圈内刷屏。这是一年一度的台北 Computex 大会,计算的世界,黄仁勋的主场。


他发布了全新的 GPU,瞄准下一代 AI 产品。外媒的评价是「强到荒谬」(ridiculous supercomputer)。


今天的GGView,就带大家一起了解了解这款专为大模型打造的全新GPU。


来源:Founder Park




小甜点

这就是游戏的未来

发布会一开始,黄仁勋就发布了用于游戏的 AI 模型渲染工具 ACE(Avatar Cloud Engine)。

这就是游戏的未来!」黄仁勋激动地说。

他展示了一段 demo,在一个 Cyberpunk 风格的酒馆里,玩家可以与 AI NPC 自由对话。


玩家说话时会有录音提示,NPC 可以很快地作出回应。据黄仁勋表示,只需要为 NPC 写好设定,不需要写脚本,就可以建立一个性格鲜明的 AI NPC。

ACE 是一个自定义 AI 模型的工坊服务(foundry service)。NPC 通过自然语言交互,具有「智能化表现」,这能大大改善玩家的游戏体验。开发者可以使用 ACE for Games 来搭建、部署定制的语音、对话和动画 AI 模型,进行中间件、工具和游戏的开发。

ACE 整个套件包括三部分:

  • NeMo 工具,用于部署大模型并过滤不适当的对话;

  • Riva 语音转文字和文字转语音组件;

  • Omniverse Audio2Face,用于将语音转换为匹配的角色表情。

ACE 来源于英伟达和创业公司 Convai 的合作。

这是 Convai 公司的产品演示视频。


新超算

主打一个大模型的「大」

黄仁勋带来了今天最重磅的发布,新款超级 GPU DGX GH200

这款超算针对 LLM、推荐系统和数据分析工作复杂的大模型开发,通过 NVLink 互连技术和 NVLink Switch System,让 256 个 GH200 超级芯片相连,作为一整个 GPU 运行。英伟达上一代系统通过 NVLink 只能连接 8 块芯片。

「这是一个 GPU,」黄仁勋说。

DGX GH200 架构相比上一代将 NVLink 带宽提升了 48 倍以上,在单个 GPU 上通过简单编程,就能够提供大型 AI 超级计算机的能力。

它提供了 1 exaFLOP 的性能,所有芯片共享 144TB 内存。对比 2020 年发布的 DGX A100,内存扩大近 500 倍。

黄仁勋透露,目前 Google Cloud、Meta 和微软已经排队预定了 DGX GH200,用于生成式 AI 相关业务。英伟达还计划将新品设计作为蓝图提供给云服务和其他大企业。


据英伟达官方透露,DGX GH200 将于今年年底上市Grace Hopper 超级芯片已经全线投入生产。

同时,英伟达还在使用 DGX GH200 打造一台更大的超级计算机,NVIDIA Helios,将搭配 4 个 DGX GH200 系统,通过 NV 自家的 Quantum-2 InfiniBand 网络互连,就是说 1024 个 Grace Hopper 超级芯片,小学乘法。今年年底发售。


干销售

还是那句老话:越买越赚

黄仁勋一如既往,现场干起了销售。他至少重复了 5 遍:「The more you buy, the more you save.

对比 CPU。

1000 万美元的成本,960 个 CPU 的数据中心,11GWh 功率,能处理 1x LLM 的数据量。

用他们的 GPU 呢,还是 1000 万美金,48 个 GPU 的数据中心,3.2GWh 功耗,44x LLM 的处理效率。

如果你就要达到 11GWh 的功耗,那么花 3400 万美金,172 个 GPU 的服务器,可以处理 150x LLM。

或者你只需要处理 1x LLM 的数据量,那么 40 万美金,2 块 GPU,0.13GWh。

几张 PPT 他切过来切过去,反复对比。

「That's right, the more you buy, the more you save. That's NVIDIA.」

黄氏销售的秘诀:小学乘法。

H100 也在台上。老黄摆出来一台 H100,说这是现在世界上最贵的计算机,20 万美元,第一个搭载 Transformer Engine 的计算机。

60 磅重(约 54 斤),他说他举得动,但考虑还要继续演讲,算了。


软硬一体

服务到位

据黄仁勋透露,全球有 4 万家大公司和 15000 家初创公司使用 NV 的技术,仅去年一年,CUDA 软件的下载量就达到 2500 万次,有的选的都选了 NV。

除了游戏产品和超算,黄仁勋还发布了一系列 AI 相关的产品和服务。

他展示了一系列生成式 AI 的应用,包括一首音乐,输入文本(歌词)就能生成一段曲子。他还兴奋地在现场玩起卡拉 OK。

一个用于创建加速服务器的模块化参考架构 NVIDIA MGX,制造商可以用它快速、经济地打造 100 多种不同的服务器配置,满足各种需求。

Grace Hopper 利用 GenAI,可以将 2D 视频通话转换为 3D 视频,次时代视频通话体验。


英伟达与软银合作,在日本建立分布式数据中心网络。

专用于提高以太网 AI 云性能和效率的网络平台 NVIDIA Spectrum-X,相比传统以太网结构,AI 性能和电源效率提高 1.7 倍。

英伟达还与微软 Windows 合作,在 PC 上开发适配 AI 的工具、框架和驱动程序,简化开发者开发和部署 AI 产品。当然是针对 RTX GPU 的 PC。

这是黄仁勋和英伟达的,不知道第多少次高光时刻,但它肯定不是最后一次。

此时此刻的英伟达,市值接近 1 万亿美元,过去五个月增长近 3 倍。

沃顿商学院教授 Jeremy Siegel 接受《财富》采访称,英伟达匹配它过去几天夸张的股价飙涨,它是一家「真正的好公司」,「没人能预测它可能涨到多高」。

「太多了,」黄仁勋在发布会最后说,「我知道太多了。」

(It's too much, I know it's too much.)

*本文首发于公众号:Founder Park,如需转载请联系微信:geekparker


温馨提示:虽然我们每天都有推送,但最近有读者表示因平台推送规则调整,有时候看不到我们的文章~

欢迎大家进入公众号页面,右上角点击“设为星标”点亮⭐️,收藏我们的公众号,新鲜内容第一时间奉上!
*文章观点仅供参考,不代表本机构立场。



微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AI教父Hinton最新采访万字实录:ChatGPT和AI的过去现在与未来 |GGViewGPT-4满分通过MIT本科数学考试!这套提示词火了|GGViewOpenAI创始人的AGI预言:AI Safety、Scaling laws与GPT-20|GGViewAI考公考编指日可待!微软华人团队发布全新基准AGIEval,专为人类考试而生「AI孙燕姿」全网沸腾!AI翻唱大爆发,整个华语乐坛都「复兴」了|GGView风口还是泡沫?一文看懂大模型背后的技术与金钱之争|GGV投资笔记第151期马斯克最新演讲:AI是一把“双刃剑”,具有控制人类的潜力|GGViewOpenAI 创始人演讲:ChatGPT 炸裂新功能,分享怎样教 AI 使用工具|GGView(古詩詞英譯) 早梅 - (明)道源《神秘花园》&《Love Me Tender》英伟达创业故事:在廉价早餐店里,想象一个空白的市场|GGView一月瘦十斤,马斯克也在用的「减肥神针」,真有那么神奇?|GGView浪费是因为缺乏想象力 : 一场关于保卫食物的尝试|GGView数据中心+储能,微软谷歌都在下场做的一件事|数字能源人靠近黑洞,会被拉成一根面条|GGView苹果首款AR眼镜卖2万5!续航2小时,近视也能用,库克:欢迎来到空间计算时代 |GGViewState of GPT:大神Andrej揭秘OpenAI大模型原理和训练过程|GGView每个烧烤师傅,可能都是一位化学大师|GGViewSam Altman 布局 Web3: 让全人类分享 AI 的利润|GGView普通人为什么今年的三伏天超长待机40天?|GGView黄仁勋口中“买越多、省越多”的GPU,如何成就芯片和服务器两大供应链?硅谷富豪们砸钱换寿命,Sam Altman也投资,能打败AI的只有长生不老了|GGView信息爆炸的 10 篇 AGI 访谈,我们从中整理了 14 个关键问题|GGView用GPT打败GPT?AutoGPT将AI进程推向了新高度!|GGView電視劇《永恆的愛》– 台詞節譯人工智能之战加剧,微软谷歌究竟谁更胜一筹?生命起源的另一种可能 |GGView癸卯花见比萨斜塔都在直回来,这个世界还有什么是可以相信的|GGView比尔·盖茨:AI 的时代已经开启|GGView中国 2030 年前载人登月;英伟达推「AI」超算,专为大模型打造;南非发现最古老人类脚印 | 极客早知道科学家发现「返老还童」蛋白!Nature:抗衰老蛋白让老年猴子恢复记忆|GGView比Transformer快4成!Meta发布全新Megabyte模型,解决算力损耗硬伤除了气候,还有很多方面都突破了地球的极限|GGView
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。