思科用这颗芯片,挑战英伟达和博通
来源:内容由半导体行业观察(ID:icbank)编译自theregister,谢谢。
思科紧随人工智能网络潮流,加入博通和英伟达的行列,推出每秒 51.2Tbit 的交换机芯片,据称能够汇集至少 32,000 个 GPU。
该交换机 ASIC 代号为 G200,是在思科的 Silicon One 产品组合下开发的,面向带宽需求大的网络规模网络以及更大的 AI/ML 计算集群。
该芯片本身提供的带宽是思科旧版 G100 ASIC 的两倍,将 112Gbit/秒串行器/解串器 (SerDes) 数量从 256 个增加到 512 个。这允许高达 64x 800Gbit/秒、128x 400Gbit/秒或 256x 200Gbit/秒的端口,具体取决于所需的应用和端口密度。
实际上,我们预计由 Cisco G200 提供支持的大部分交换机的上限为 400Gbit/秒——这是当今 PCIe 5.0 NIC 支持的最大带宽,并且除了聚合之外,没有那么多应用程序可以利用首先是 800Gbit/sec 以太网。
如果您此时感觉有点似曾相识,那可能是因为我们已经看到了 Broadcom 和 Nvidia 的类似 ASIC 和交换机,分别有他们的 Tomahawk 5 和 Spectrum-4 系列。这两款交换机都拥有 51.2Tbit/秒的带宽,并被定位为大型 GPU 计算集群的 InfiniBand 网络的替代品。
事实上,思科 G200 承诺提供许多与竞争对手网络供应商承诺的相同的以 AI/ML 为中心的特性和功能。这三者都承诺提供先进的拥塞管理、数据包喷射技术和链路故障转移等功能。
这些功能非常重要,因为除了 GPU 能够使 400Gbit/sec 链路完全饱和之外,工作负载在这些集群之间的分布方式也使得它们对延迟和拥塞特别敏感。如果流量出现备份,GPU 可能会闲置,从而导致作业完成时间更长。
所有三个供应商都会告诉您,这些功能与融合以太网上的 RDMA (RoCE) 等功能相结合,可以使用标准以太网实现极低损耗的网络,并进一步缩短完成时间。
“市场上显然有多种 51.2Tbit/sec 交换机。我对这种情况的看法是,并非所有 51.2Tbit/sec 交换机都是一样的。很多人提出主张,但很少有人兑现这些主张,”思科 Silicon One 产品线营销负责人Rakesh Chopra告诉The Register。
虽然 Broadcom 和 Nvidia 可能已经在市场上击败了 Cisco,但 Chopra 认为 G200 的关键区别之一是支持 512x 基数配置。无需深入讨论细节,较大的基数意味着更小、更紧密的交换结构。
思科声称,与类似的 256x 基数交换机相比,这使得 G200 能够扩展以支持超过 32,000 个 GPU(或大约 4,000 个节点)的集群,使用的交换机数量减少了 40%,光学器件数量减少了一半。据我们所知,这是 Broadcom 的 Tomahawk 5 的一个镜头,它突出了 256x 200Gbit/sec 基数,尽管它也适用于 Nvidia 的 Spectrum-4。
思科声称其 Silicon One G200 ASIC 可以实现更密集、更高效的网络,如所提供的图形所示 -
Chopra 声称思科能够做到这一点,因为 Silicon One 的技术比竞争对手的交换机“高效”得多。我们不知道效率有多高——Chopra 不会告诉我们 G200 使用了多少功率。
他确实表示,对于能够支持 32,000 个 GPU 的网络拓扑,与竞争产品相比,使用基于 G200 的交换机将节省近兆瓦的功耗。虽然这听起来令人印象深刻,但您可能不会注意到,考虑到这种规模的集群在负载下容易拉动超过 40MW,而且这还是在考虑数据中心冷却之前。
即便如此,Chopra 认为,任何节省都是值得的,特别是对于那些可持续发展目标要求抵消其使用电力的公司来说。
然而,博通核心交换团队高级副总裁 Ram Velaga在给The Register的一封电子邮件中表示,思科描述的例子不切实际,永远不会在现实世界中部署。
“例如,他们显示结构中的 100Gbit/秒链路正在转换为到 GPU 的 400Gbit/秒链路,这意味着您无法使用直通操作。相反,您需要使用更高延迟的存储,并且-前进行动,”Velaga写道。
Velaga 补充说,Tomahawk 5 实际上可以通过使用 768 台交换机的两层网络支持 32,000 个 GPU 集群——与思科的数量相同。
我们还联系了英伟达寻求评论,但截至发稿时尚未收到回复。
Silicon One ASIC 目前已交到客户手中,用于集成到最终产品中。然而,Chopra并没有承诺最终产品进入数据中心的时间表。
点击“阅读原文”,可参考英文原文。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3441期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者