博通评论英伟达竞品:没有独到之处
来源:内容由半导体行业观察(ID:icbank)编译自The Register,谢谢。
在早前举办的Computex,Nvidia 通过推出其 Spectrum-X 平台承诺为生成 AI 工作负载提供“无损以太网”——但如果你问 Broadcom,这甚至不是一个新想法。
Broadcom 核心交换组高级副总裁 Ram Velaga 告诉The Register说:“他们的设备没有什么我们没有的独特之处。”
他解释说,Nvidia 实际上用 Spectrum-X 所做的是构建一个垂直集成的以太网平台,该平台擅长以最小化尾延迟和减少 AI 作业完成时间的方式管理拥塞。
Velaga 认为,这与 Broadcom 对其Tomahawk5和Jericho3-AI交换机 ASIC所做的没有什么不同。他还认为 Nvidia 承认以太网对于处理 AI 中的 GPU 流更有意义。
Nvidia 的 Spectrum-X
就 Nvidia 而言,它并没有放弃 InfiniBand 网络。InfiniBand 非常适合那些运行少量非常大的工作负载的用户——例如 GPT3 或数字孪生。然而,Nvidia 网络部门营销副总裁 Gilad Shainer 告诉The Register,在某些环境中,尤其是多租户云,以太网是首选。
Shainer 说,对于较小的 AI/ML 工作负载,传统的以太网基础设施工作得很好——但现在这些工作负载的增长超出了一个节点,速度太慢了。
Nvidia 的 Spectrum-X 平台声称可以应对这一挑战。
需要明确的是,Nvidia 的 Spectrum-X 不是产品。它是硬件和软件的集合,我们过去已经介绍了其中的大部分内容。核心组件包括 Nvidia 的 51.2Tbit/sec Spectrum-4 以太网交换机和BlueField-3数据处理单元 (DPU)。
基本思想是,只要您同时使用 Nvidia 的交换机和它的 DPU,它们就会协同工作以缓解流量拥塞,并且——如果 Nvidia 可信的话——完全消除数据包丢失。
虽然 Shainer 声称这是 Nvidia 的一个全新功能单元,但 Velaga 认为“无损以太网”的想法只是营销。“与其说它是无损的,不如说你有效地管理了拥塞,以至于你拥有了一个非常高效的以太网结构,”他争辩道。
换句话说,不是包丢失是给定的以太网网络,而是规则的例外。无论如何,这就是想法。
此外,Velaga 声称这种拥塞管理已经内置到 Broadcom 最新一代的交换机 ASIC 中——只有它们可以与任何供应商或云服务提供商的 smartNIC 或 DPU 一起使用。“你不必在 NIC 上做,你可以从一个 Jericho3-AI 到另一个 Jericho3-AI ,”他补充道。
当我们向 Shainer 询问 Broadcom 的 Tomahawk5 和 Jericho3-AI 时,他拒绝与这些芯片进行比较,他辩称 Spectrum-X 属于自己的一类,并暗示一些供应商只是将“AI”附加到现有产品上。
“无论你怎么称呼它,都没有任何东西具有专为 AI 设计的功能,”他说。
垂直整合与分解
根据 Velaga 的说法,Nvidia 试图实现的垂直整合与以太网相冲突。“以太网今天成功的全部原因是它是一个非常开放的生态系统,”他说。
正因为如此,Nvidia 的 Spectrum-X 可能被证明对云提供商来说是一个艰难的销售,云提供商倾向于尽可能避免供应商锁定。他们强烈希望避免这种情况,导致广泛采用与供应商无关的网络操作系统,如 SONiC。这使他们能够在任何兼容的交换机上运行他们的云。
就其价值而言,Nvidia 的 Spectrum-4确实支持 SONiC,以及它自己的 Cumulus NOS 和 Linux Switch 驱动程序。但是,由于 Spectrum-X 平台依赖于同时拥有 Spectrum-4 和 BlueField,因此您不能只将一个换成另一个兼容 SONiC 的开关或 DPU 而不会损失功能。
说到 DPU,许多最大的云服务提供商已经拥有适合其环境的 SmartNIC。Amazon Web Services 拥有 Nitro,Google 与 Intel 共同开发了基于 ASIC 的 SmartNIC,Microsoft在 1 月份收购了 Fungible 。这些设备对云提供商来说非常有价值,因为它们允许他们卸载常见的网络、存储和安全工作负载——释放 CPU 来运行租户工作负载。
Shainer 说这完全没问题。他认为云提供商可以使用他们现有的 DPU 来管理他们的基础设施和控制南北流量,并使用 Nvidia 的 BlueField-3 来控制集群中节点之间的东西向流量。
他补充说,也没有什么能阻止人们将 Nvidia 的交换机或 DPU 作为独立产品进行部署。
“如果有人想使用我们的交换机并构建他们自己的东西,我们非常欢迎。如果有人想使用我们的 DPU 并使用其他人的交换机,当然 - 去吧。你可以自己开发这些东西,”Shainer 说。“但是,如果你想获得完全优化的东西,全堆栈......并在四个星期而不是六、七或八个月内启动系统?无价之宝。”
Broadcom 的 Velaga 不太确定客户会如何接受这个想法。“很难说在一个一切都被分解的世界里,他们将如何销售垂直集成以太网解决方案的价值。”
👇👇 点击文末【阅读原文】,可查看原文链接!
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3428期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者