Redian新闻
>
思科用这颗芯片,挑战英伟达和博通

思科用这颗芯片,挑战英伟达和博通

公众号新闻

来源:内容由半导体行业观察(ID:icbank)编译自theregister,谢谢。


思科紧随人工智能网络潮流,加入博通和英伟达的行列,推出每秒 51.2Tbit 的交换机芯片,据称能够汇集至少 32,000 个 GPU。


该交换机 ASIC 代号为 G200,是在思科的 Silicon One 产品组合下开发的,面向带宽需求大的网络规模网络以及更大的 AI/ML 计算集群。


该芯片本身提供的带宽是思科旧版 G100 ASIC 的两倍,将 112Gbit/秒串行器/解串器 (SerDes) 数量从 256 个增加到 512 个。这允许高达 64x 800Gbit/秒、128x 400Gbit/秒或 256x 200Gbit/秒的端口,具体取决于所需的应用和端口密度。


实际上,我们预计由 Cisco G200 提供支持的大部分交换机的上限为 400Gbit/秒——这是当今 PCIe 5.0 NIC 支持的最大带宽,并且除了聚合之外,没有那么多应用程序可以利用首先是 800Gbit/sec 以太网。


如果您此时感觉有点似曾相识,那可能是因为我们已经看到了 Broadcom 和 Nvidia 的类似 ASIC 和交换机,分别有他们的 Tomahawk 5 和 Spectrum-4 系列。这两款交换机都拥有 51.2Tbit/秒的带宽,并被定位为大型 GPU 计算集群的 InfiniBand 网络的替代品。


事实上,思科 G200 承诺提供许多与竞争对手网络供应商承诺的相同的以 AI/ML 为中心的特性和功能。这三者都承诺提供先进的拥塞管理、数据包喷射技术和链路故障转移等功能。


这些功能非常重要,因为除了 GPU 能够使 400Gbit/sec 链路完全饱和之外,工作负载在这些集群之间的分布方式也使得它们对延迟和拥塞特别敏感。如果流量出现备份,GPU 可能会闲置,从而导致作业完成时间更长。


所有三个供应商都会告诉您,这些功能与融合以太网上的 RDMA (RoCE) 等功能相结合,可以使用标准以太网实现极低损耗的网络,并进一步缩短完成时间。


“市场上显然有多种 51.2Tbit/sec 交换机。我对这种情况的看法是,并非所有 51.2Tbit/sec 交换机都是一样的。很多人提出主张,但很少有人兑现这些主张,”思科 Silicon One 产品线营销负责人Rakesh Chopra告诉The Register。


虽然 Broadcom 和 Nvidia 可能已经在市场上击败了 Cisco,但 Chopra 认为 G200 的关键区别之一是支持 512x 基数配置。无需深入讨论细节,较大的基数意味着更小、更紧密的交换结构。


思科声称,与类似的 256x 基数交换机相比,这使得 G200 能够扩展以支持超过 32,000 个 GPU(或大约 4,000 个节点)的集群,使用的交换机数量减少了 40%,光学器件数量减少了一半。据我们所知,这是 Broadcom 的 Tomahawk 5 的一个镜头,它突出了 256x 200Gbit/sec 基数,尽管它也适用于 Nvidia 的 Spectrum-4。


思科声称其 Silicon One G200 ASIC 可以实现更密集、更高效的网络,如所提供的图形所示 - 



Chopra 声称思科能够做到这一点,因为 Silicon One 的技术比竞争对手的交换机“高效”得多。我们不知道效率有多高——Chopra 不会告诉我们 G200 使用了多少功率。


他确实表示,对于能够支持 32,000 个 GPU 的网络拓扑,与竞争产品相比,使用基于 G200 的交换机将节省近兆瓦的功耗。虽然这听起来令人印象深刻,但您可能不会注意到,考虑到这种规模的集群在负载下容易拉动超过 40MW,而且这还是在考虑数据中心冷却之前。


即便如此,Chopra 认为,任何节省都是值得的,特别是对于那些可持续发展目标要求抵消其使用电力的公司来说。


然而,博通核心交换团队高级副总裁 Ram Velaga在给The Register的一封电子邮件中表示,思科描述的例子不切实际,永远不会在现实世界中部署。


“例如,他们显示结构中的 100Gbit/秒链路正在转换为到 GPU 的 400Gbit/秒链路,这意味着您无法使用直通操作。相反,您需要使用更高延迟的存储,并且-前进行动,”Velaga写道。


Velaga 补充说,Tomahawk 5 实际上可以通过使用 768 台交换机的两层网络支持 32,000 个 GPU 集群——与思科的数量相同。


我们还联系了英伟达寻求评论,但截至发稿时尚未收到回复。


Silicon One ASIC 目前已交到客户手中,用于集成到最终产品中。然而,Chopra并没有承诺最终产品进入数据中心的时间表。


点击“阅读原文”,可参考英文原文。

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3441期内容,欢迎关注。

推荐阅读


从顶会50年,看计算机体系架构变迁

思科,豪赌芯片

先进封装,格局生变!


半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码,回复下方关键词,阅读更多

晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装

回复 投稿,看《如何成为“半导体行业观察”的一员 》

回复 搜索,还能轻松找到其他你感兴趣的文章!

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
AMD的千亿晶体管芯片,叫板英伟达H100马斯克:英伟达不会永远垄断AI芯片市场;王传福警告:汽车行业已进入淘汰赛阶段;罗永浩卸任VR公司所思科技董事丨邦早报256TOPS、35W,后摩用一颗芯片掀起智能驾驶新战事英伟达发布AI芯片,明年二季度供货!黄仁勋称“它会疯狂推理”挑战英伟达,AMD即将推出AI芯片MI300X没用还可能有害的儿科用药(2023版)这颗芯片,旨在替代INFINIBAND !芯片战争,挑战美国的野心5055 血壮山河之武汉会战 鏖战幕府山 24小鹏智能驾驶「灵魂人物」出走,英伟达和大众都盯上中国新势力苏姿丰欲战英伟达「AI王座」,执掌九年如何咸鱼翻身?移民生活(五)英伟达和特斯拉大涨后,“木头姐”开始套现首发上车领克08,这颗「中国芯」挑战「高通」的独孤求败挑战TikTok“地铁冲浪” 两名14岁男孩一死一重伤!社媒各类恐怖挑战何时休?“昏迷挑战”、“破颅挑战”已造成多人死亡传中国厂商扫货英伟达GPU,豪掷50亿买芯片,订单已经排到2024年美国芯片巨头市值一夜暴涨1.34万亿!一颗芯片炒到4万美元,马斯克此前狂买1万个女追男隔层纱,男追女隔座山成功在于远见?英伟达CEO称英伟达5年前把一切都押在了AI上获英伟达和Accel9000万美金投资,AI视频Synthesia要对标Runway?英特尔发布中国定制版大模型专用芯片Gaudi2,用性价比挑战英伟达|甲子光年一颗芯片的典型设计流程苹果将在iPhone芯片上省数十亿美元/英伟达推出AI超级芯片/万达回应副总裁被带走调查年度最绝融资:拿英伟达H100抵押贷款165亿,买更多英伟达GPU扩建10个数据中心老黄又来“抢钱”:英伟达再推超强芯片平台,守住万亿芯片老大擂台AMD发起AI芯片挑战,但英伟达依然独孤求败|甲子光年这颗芯片,暗藏AI未来!博通评论英伟达竞品:没有独到之处MD推出新AI芯片MI300X,应战英伟达,芯片市场竞赛升温|最前线2860元的垃圾桶火了;思科斥资1.5亿美元收购WG2;初创公司靠软件挑战NVIDIA的AI垄断 | AIoT情报沁园春 雷电天气倒装芯片,挑战越来越大英伟达发布新一代超级芯片平台/苹果能在芯片上省数十亿美元/华为系统云翻新功能上线多少恶毒,以正义之名英伟达和 Accel 投 9000 万美金,又一个 AI 视频独角兽来了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。