挑战英伟达,AMD官宣年更芯片!新款MI325X重磅发布,比H200快1.3倍
新智元报道
新智元报道
【新智元导读】AMD在Computex主题演讲上大出风头,推出了首批Zen 5处理器,包括台式机用Ryzen 9000 CPU和笔记本电脑用Ryzen AI 300「Strix Point 」APU。除此之外,AMD还宣布了芯片年更计划以及备受期待的第五代EPYC Turin处理器。
昨天,老黄在Computex上的演讲再一次让英伟达成为全世界的焦点,而同在芯片产业的AMD也不甘落后,推出了更强大的产品组合,全面进军AI PC 领域。
芯片年更,与领头羊英伟达一较高下
自去年以来,英伟达向投资者明确表示,计划将发布周期缩短为每年一次,现在AMD也紧随其后,开始芯片年更。
首席执行官苏姿丰(Lisa Su)表示「每年都有这样的节奏,是因为市场需要更新的产品和能力...... 我们每年都会有下一个大事件,这样我们就始终拥有最具竞争力的产品组合。」
她详细介绍了该公司未来两年开发人工智能芯片的计划,以挑战行业领导者英伟达。
最新的MI325X加速器将于2024年第四季度上市。
即将推出的名为MI350的芯片系列,预计将于2025年上市,并将基于新的芯片架构。与现有的MI300系列人工智能芯片相比,MI350在推理方面的性能预计将提高35倍。
2026年,MI400系列将会被推出,该系列将基于名为「Next」的架构。
如此这般,AMD和英伟达「你方唱罢我登场」,两者之间的较量充满了刀光剑影。
开发生成式人工智能程序的竞赛催生了人工智能数据中心的发展,而支撑数据中心的就是这些先进芯片。
AMD一直是英伟达的竞争者,后者目前主导着利润丰厚的人工智能半导体市场,占据了约80%的份额。
现在,为了追赶英伟达,AMD更加孤注一掷,「人工智能显然是我们公司的头等大事,我们确实利用了公司内部所有的开发能力来实现这一点。」
先不管芯片表现如何,AMD此举也是为了吸引投资者的关注。
在华尔街「铲子」交易中投入了数十亿美元的投资者一直在寻求芯片公司的长期更新,因为他们要评估生成式AI蓬勃发展的持久性,而这一趋势迄今为止还没有放缓的迹象。
自2023年初以来,AMD股价已上涨一倍多。与同期英伟达股价七倍多的涨幅相比,这一涨幅仍然相形见绌。
苏姿丰在4月份表示,AMD预计2024年AI芯片销售额约为40亿美元,比之前的估计增加了5亿美元。
在Computex活动上,AMD还表示其最新一代中央处理器单元(CPU)可能会在2024年下半年上市。
虽然企业一般会优先考虑在数据中心中使用人工智能芯片,但AMD的部分CPU也会与GPU结合使用,不过两者的比例更倾向于GPU。
AMD详细介绍了其新型神经处理单元(NPU)的架构,专门用于处理AI PC中的设备端AI任务。
随着个人电脑市场走出长达数年的低谷,芯片制造商们一直寄希望于人工智能功能的增强来推动个人电脑市场的增长。
惠普和联想等个人电脑供应商将发布包含AMD AI PC芯片的设备。AMD还放出话来,他们的处理器已经超过了微软对Copilot+PC的硬件要求。
3nm EPYC Turin,AI负载超越英特尔
苏姿丰在Computex 2024的主题演讲中宣布,备受期待的第五代EPYC Turin处理器,具有192个核心和384个线程,在人工智能工作中比英特尔Xeon快5.4倍,将于2024年下半年推出。
这个3nm芯片标志着AMD Zen 5架构首次应用于数据中心芯片,AMD声称它们在关键AI工作负载上的性能比英特尔当前一代的Xeon芯片快5.4倍。
Turin据说有两个版本:一个使用标准的Zen 5核心,另一个使用一种称为Zen 5c的密度优化核心。苏姿丰还宣布,AMD现在已经占据了数据中心市场的33%。
新的Zen 5c芯片将配备多达192个核心和384个线程,采用3nm工艺节点制造,然后与塞入单个插槽的6nm I/O Die(IOD)配对。
整个芯片由17个小单元组成。最高核心数型号采用AMD的Zen 5c架构,该架构使用密度优化的核心,概念上类似于英特尔的e-cores。不过,AMD率先在数据中心的x86芯片中使用这种核心类型。
配备标准全性能Zen 5核心的型号配备12 个采用N4P工艺节点的计算芯片和一个中央6纳米IOD芯片,总共13个小芯片。
AMD声称,在LLM(聊天机器人)中,AMD的优势是Xeon的5.4倍,在翻译模型中是Xeon的2.5倍,在摘要工作中是Xeon的3.9倍。
AMD还展示了其128核Turin模型在科学NAMD工作负载中的3.1倍优势,并现场演示了Turin每秒生成的token数量比Xeon多4倍。
192核Zen 5c芯片是AMD EPYC Bergamo的后续系列,后者是业界首款具有密度优化核心的x86数据中心处理器(Zen 4c)。Bergamo的最高核心为128个。
采用Zen 5架构的标准Turin型号可扩展到128个核心,每个核心面积减半但功能不变,与当前一代EPYC Genoa(最高96个核心)相比,实现了强劲的代际提升。
Zen 5c Turin芯片将与英特尔的144核Sierra Forest芯片和Ampre的192核 AmpereOne处理器展开竞争,前者标志着英特尔在其Xeon数据中心阵容中首次采用效率核心(E-cores),后者则标志着谷歌和微软正在开发或采用定制芯片。
与此同时,标准的Zen 5 EPYC处理器将迎战英特尔即将推出的Xeon 6系列。
AMD还分享了一些基准测试,以突出它相对于英特尔竞争型号的优势。随着Turin 芯片越来越接近市场,我们可以期待更多的细节。
Ryzen AI 300系列「Strix Point」处理器
AMD揭开Ryzen AI 300系列「Strix Point」处理器的神秘面纱——50 TOPS的AI性能,Zen 5c密度核心首次应用于Ryzen 9。
Strix Point APU配备了XDNA 2 AI加速器,AMD表示该加速器能够实现高达50 TOPS的性能,领先于最近微软使用的高通骁龙X Elite(45 TOPS)。
作为一款具有强大集成显卡的APU,游戏也是测试的一部分。
AMD希望通过其集成Radeon 880M和890M GPU来确保游戏领域的领先地位。
根据AMD的演示,Ryzen AI 300系列芯片平均性能比英特尔Core Ultra 185H快36%。
这里的平均分数取自六款主要游戏的基准测试,包括《赛博朋克 2077》、《无主之地 3》、《F1 23》、《刺客信条幻影》、《古墓丽影:暗影》和《孤岛惊魂 6》。
代号为Strix Point的全新Ryzen AI 300系列芯片,采用全新的Zen 5 CPU微架构,拥有两种核心、升级的RDNA 3.5图形引擎,当然还有AMD全新的XDNA 2引擎,可在本地运行AI工作负载。
AMD的新品牌方案现在将AI直接带入了芯片名称中,这反映了公司对以AI为重点的全新XDNA 2神经处理单元(NPU)的强烈关注。
XDNA 2现在可提供50 TOPS的性能,是AMD第三代AI处理器性能的5倍。
这一性能水平超越了Windows PC的所有其他芯片,包括高通公司前景看好的骁龙X Elite,并轻松超过了微软对下一代AI PC的40TOPS要求,这是在本地运行Copilot的最低硬件要求。
AMD在其他方面也取得了很多进步,针对轻薄型和超轻型笔记本电脑的Zen 5处理器已升级到12核,过去只能使用8个CPU核心,而新的RDNA 3.5集成图形引擎最多可使用16个计算单元,比上一代的最多12个有所增加。
旗舰级Ryzen AI 9 HX 370配备了12个核心和24个线程,基本频率为2.0 GHz,峰值频率为5.1GHz。
不过,从品牌宣传幻灯片中可以看到,该芯片与GPU和NPU核心一起,在单片芯片上配备了4个标准Zen 5核心和8个密度优化的Zen 5C核心。
这标志着更小的Zen 4c核心首次出现在最高级别的Ryzen 9移动系列中,因为这些核心以前仅限于AMD采用上一代鹰点芯片的最低端Ryzen 5和3型号。
与标准的Zen 5性能核心相比,AMD的Zen 5c核心旨在减少处理器芯片上的空间占用,同时为要求不高的任务提供足够的性能,从而节省电能,并在每平方毫米上提供比以前更多的计算能力。
虽然这种技术在概念上与英特尔的E-cores类似,但AMD的Zen 5c采用了与标准Zen 5核心相同的微架构,并通过较小的核心支持相同的功能,而英特尔的设计则采用了不同的架构和功能支持。
不过,较小的Zen 5c核心工作时钟频率较低,因此峰值性能不如标准核心,但它们也为其他附加功能(如更大的GPU和NPU)保留了芯片面积。
HX 370芯片还拥有36 MB三级缓存、50 TOPS XDNA 2 NPU和新的RDNA 3.5 Radeon 890M图形引擎。
该芯片的额定TDP为 28W,但其宽泛的cTDP范围意味着这并不能反映其实际运行功耗水平。
Ryzen AI 9 365配备10个核心,包括4个标准Zen 5核心和6个经过密度优化的Zen 5c核心,基本频率为2.0GHz,峰值频率为5.0 GHz。
该芯片还配备了50 TOPS NPU和一个12-CU RDNA 3.5 Radeon 880M图形引擎,运行频率为2.9 GHz。
虽然CPU和GPU核心数较低,但这款芯片的TDP也和它的「老大哥」一样,达到了28W,尽管这个评级现在的重要性值得怀疑。
AMD的上一代7040和8040系列共有九个型号,因此这两款新的Ryzen AI 300显然只是AMD新的人工智能产品系列的第一炮。
AMD Ryzen 9 AI 300系列基准测试表现如何呢?
AMD声称LLLM模型比当今市场上的移动处理器具有5倍的性能优势,但值得注意的是,尚未发布的45TOPS高通骁龙X Elite和48 TOPS Lunar Lake并未包含在这些基准测试中。
不过,AMD与高通公开发布的生产力工作基准数据进行了比较,声称Ryzen AI 9 HX 370在响应速度方面有5%的优势,在生产力工作负载方面有10%的优势。
该公司还提供了高达60%的性能优势图形性能突显其游戏实力。苹果的M3也被拉来比较,AMD声称在生产力方面有9%的优势,在视频编辑方面有11%的优势,在3D渲染方面有98%的优势。
英特尔的Core Ultra 185H也出现在AMD的基准测试名单中,AMD声称它在工作负载方面领先4%,在视频编辑方面领先40%,在3D渲染方面领先73%。在一系列游戏中,iGPU性能比Core Ultra 185H高出36%。
接下来,压力就给到英特尔即将在第三季度推出的Lunar Lake处理器了。
AMD决定在其顶级Ryzen 9系列中采用密度优化的Zen 5c核心,这使其能够在更小的芯片面积上容纳更强的计算能力,从而为大幅扩展iGPU和NPU留出空间,这两者将在游戏和人工智能等其他方面带来红利。
凭借full-fat Zen 5核心的性能优势,以及更快、更高效的新工艺节点,Ryzen AI 300系列芯片与英特尔、高通和苹果的芯片相比极具竞争力,为2024年移动市场的激烈竞争奠定了基础。
现在剩下的就是在第三方基准测试中看看这些芯片的表现了,这些芯片预计将于2024年7月面世,我们拭目以待。
微信扫码关注该文公众号作者