Redian新闻
>
黄仁勋在COMPUTEX大会上说了什么?这里是最全的亮点

黄仁勋在COMPUTEX大会上说了什么?这里是最全的亮点

公众号新闻

5月29日周一,英伟达CEO黄仁勋在COMPUTEX大会上抛出多个重磅信息,包括新的机器人设计、游戏功能、广告服务和网络技术。其中最为引人瞩目的是,搭载256颗GH200 Grace Hopper超级芯片的新型DGX GH200人工智能超级计算机,堪称“算力杀器”。

谷歌云、Meta和微软是首批预计将获得DGX GH200访问权的客户,以探索其在生成型AI工作负载方面的能力。值得注意的是,算力的突破,将使得AI应用再次获得巨大提升,AI赛道有望向下一个节点迈进。在周一的演讲中,黄仁勋认为科技行业的传统架构的改进速度已不足以跟上复杂的计算任务。为了充分发挥AI 的潜力,客户越来越多地转向加速计算和英伟达制造的GPU。

黄仁勋说:

我们已到达生成式AI引爆点。从此,全世界的每个角落,都会有算力需求。

有评论认为,一连串的发布凸显了英伟达正在从一家GPU制造商转变为一家处于AI热潮中心的公司。

上周,由于对处理AI任务的数据中心芯片的强烈需求,英伟达大幅提高了对本季度的业绩指引,比分析师的估计高出近40亿美元。业绩指引的提高使该股创下历史新高,并使英伟达的估值接近1万亿美元,这还是芯片业中首次有公司市值达到这一高度。

在周一的会议上,黄仁勋发布的主要内容包括:

  • 英伟达面向游戏玩家的GForce RTX 4080 Ti GPU现已全面投产,并已经开始量产。
  • 黄仁勋宣布推出适用于游戏的英伟达Avatar Cloud Engine(ACE),这是一种可定制的AI模型代工服务,为游戏开发人员提供预训练模型。它将通过AI支持的语言交互赋予非玩家角色更多个性。

  • 英伟达Cuda计算模型现在服务于400万开发者和超过3000个应用程序。Cuda的下载量达到了4000万次,其中仅去年一年就达到了2500万次。
  • GPU服务器HGX H100的全面量产已经开始,他补充说,这是世界上第一台装有变压器引擎的计算机。
  • 黄仁勋将英伟达2019年以69亿美元收购超级计算机芯片制造商Mellanox称为其有史以来做出的“最伟大的战略决策之一”。
  • 下一代 Hopper GPU的生产将于2024年8月开始,也就是第一代开始生产两年后。
  • 英伟达的GH200 Grace Hopper现已全面投产。超级芯片提升了4 PetaFIOPS TE、72个通过芯片到芯片链路连接的Arm CPU、96GB HBM3和576 GPU内存。黄仁勋将其描述为世界上第一个具有巨大内存的加速计算处理器:“这是一台计算机,而不是芯片。” 它专为高弹性数据中心应用而设计。
  • 如果Grace Hopper的内存不够用,英伟达有解决方案——DGX GH200。它是通过首先将8个Grace Hoppers与3个NVLINK交换机以900GB传输速度的Pod连接在一起,再将32个这样的组件连接在一起,再加上一层开关,连接总共256个Grace Hopper芯片。由此产生的 ExaFLOPS Transformer Engine具有144 TB的GPU内存,可用作巨型GPU。黄仁勋说Grace Hopper速度非常快,可以在软件中运行5G堆栈。谷歌云、Meta和微软将是第一批获得DGX GH200 访问权限的公司,并将对其功能进行研究。

  • 英伟达和软银已建立合作伙伴关系,将Grace Hopper超级芯片引入软银在日本的新分布式数据中心。这些将能够在多租户通用服务器平台中托管生成式人工智能和无线应用程序,从而降低成本和能源。
  • 软银和英伟达的合作伙伴关系将基于英伟达MGX参考架构,该架构目前正在与一些公司合作使用。它为系统制造商提供了一个模块化的参考架构,帮助他们构建100多个用于AI、加速计算和全方位用途的服务器变体。合作的公司包括ASRock Rack、Asus、Gigabyte、Pegatron、QCT和Supermicro。
  • 黄仁勋发布了Spectrum-X加速网络平台,以提高基于以太网的云的速度。它包括Spectrum 4交换机,它有128个端口,每秒400GB和每秒51.2TB的传输速度。黄仁勋说,该交换机旨在实现新型以太网,并设计为端到端以进行自适应路由、隔离性能和进行结构内计算。它还包括Bluefield 3 Smart Nic,它连接到Spectrum 4交换机以执行拥塞控制。

  • 世界上最大的广告公司WPP已与英伟达Nvidia 合作开发基于英伟达Omniverse的内容引擎。它将能够制作用于广告的照片和视频内容。WPP首席执行官马克·里德在一份声明中表示:“生成式AI正以惊人的速度改变着广告行业,这项新技术将改变知名品牌创建商业内容的方式。”据WPP称,新平台将使WPP的创意团队能够将Adobe和Getty Images等公司的内容与生成式人工智能相结合,更高效、更大规模地制作广告内容。该公司补充说,这将使公司能够制作大量的广告内容,如文本、图片或视频,实现量身定制,并更有沉浸感。
  • 机器人平台英伟达Isaac ARM现在可供任何想要构建机器人的人使用,并且是全栈的,从芯片到传感器。Isaac ARM从名为 Nova Orin 的芯片开始,是第一个机器人全参考堆栈,Huang 说。
在发布会上,黄仁勋还展示了生成式AI以文字形式输入然后以其他媒体输出内容的能力。他要求播放与清晨心情相配的音乐,而在另一篇文章中,他列出了一些歌词,然后使用AI将这个想法转化为一首活泼的流行歌曲:

现在每个人都是创作者。

值得注意的是,本次大会上,黄仁勋向传统CPU服务器集群发起“挑战”。他直言,认为在人工智能和加速计算这一未来方向上,GPU服务器有着更为强大的优势。
黄仁勋解释称,传统上电脑或服务器最重要的 CPU,这个市场主要参与者包括英特尔和AMD。但随着需要大量计算能力的AI应用出现,GPU将成为主角,英伟达主导了当前全球AI GPU 市场。 
黄仁勋在演讲上展示的范例,训练一个LLM大语言模型,将需要960个CPU组成的服务器集群,这将耗费大约1000万美元,并消耗11千兆瓦时的电力。相比之下,同样以1000万美元的成本去组建GPU服务器集群,将以仅3.2千兆瓦时的电力消耗,训练44个LLM大模型。
如果同样消耗11千兆瓦时的电量,那么GPU服务器集群能够实现150倍的加速,训练150个LLM大模型,且占地面积更小。而当用户仅仅想训练一个LLM大模型时,则只需要一个40万美元左右,消耗0.13千兆瓦时电力的GPU服务器即可。
换言之,相比CPU服务器,GPU服务器能够以4%的成本和1.2%的电力消耗来训练一个LLM,这将带来巨大的成本节省。
根据Trend Force的数据,2022年搭载GP GPU的AI服务器年出货量占全部服务器的比重接近1%,2023年在ChatGPT等人工智能应用加持下,AI服务器出货量有望同比增长8%,2022~2026年出货量CAGR有望达10.8%,以AI服务器用GPU,主要以公司H100、A100、A800(主要出货中国)以及AMD MI250、MI250X系列为主,而英伟达与AMD的占比约8:2。
基于IDC预测2026年全球服务器出货量1877万台、AI服务器的占比逐年提升1%,同时AI服务器中GPU的搭载数量逐年提升0.5个百分点、随着GPU产品迭代,GPU单价逐年提升2000美元,国金证券基于上述基础预测,2026年全球数据中心GPU市场规模有望达224亿美元。

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Npj Comput. Mater.: 二维过渡金属单卤化物—超导和拓扑态Npj Comput. Mater.: 让马儿跑得又快又准—晶格热导率预测厉害国: 比银行倒闭更吓人的事Npj Comput. Mater.: 高热电性能—全赫斯勒化合物Hooray , 长了10磅Npj Comput. Mater.: “鱼与熊掌”可以兼得—兼具高精度、高速度的分子动力学!Npj Comput. Mater.: 轨道耦合—调控谷能带和激子劈裂名师观点丨白重恩:中国数字经济发展的亮点Npj Comput. Mater.: 表面合金化学吸附—d带中心模型能否适用?Npj Comput. Mater.: 纵然藏她千百度,暮回首,AI把她全揭露!Npj Comput. Mater.: 自旋极化—非易失电调控Npj Comput. Mater.: 金属3D打印质量参差不齐?为你揭开这些关键之谜!马斯克在股东大会上说了句话,特斯拉涨了 50 亿美元Npj Comput. Mater.: 搭乘“特快列车”的异相催化原子模拟Npj Comput. Mater.: 基于二维范德华异质结能带调控的平面铁电隧道结Npj Comput. Mater.: 一维范德华异质结很迷人,但曲率如何改变电子性质太劳神!Npj Comput. Mater.: 单原子催化剂动态电荷转移—找CeO2试一下2013-2023年间,英国各地房价表现如何?这里是最大赢家!Npj Comput. Mater.: 自由电子金属—原来可以这样做电子关联!Npj Comput. Mater.: 中大、清华、加大尔湾分校合作发现新型二维磁性材料《满城烟花》&《沏春》巴菲特在股东大会上说:我看简历从不看是哪个学校毕业的maxsun GeForce GTX 1660 Super Terminator Computer Video GraphicsNpj Comput. Mater.: 高兴发团队很不高兴—与电子推推拉拉,成何体统?Npj Comput. Mater.: 超快激光的妙手真可“点石(墨)成金(刚石)”Npj Comput. Mater.: DFT中的电子密度—等变图神经网络Npj Comput. Mater.: 原子间固有的游戏规则—设计人工智能材料Npj Comput. Mater.: 未知磁结构材料的拓扑性表征—不准,但有点意义Npj Comput. Mater.: 一叶知秋—材料科学中的小数据机器学习Npj Comput. Mater.: 反铁磁遇到铁电—也有心灵感应Npj Comput. Mater.: 拌水泥的高科技—机器学习为混凝土配方而设计半导体设备,唯一的亮点?Npj Comput. Mater.: 氧化物中的拓扑态—如何不再众里寻她千百度?人怎样提高自己的灵魂等级?从短轮到周受资---谈谈华裔印象的变迁
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。