英伟达向以太网敞开怀抱公众号新闻2024-06-07 09:06Infini Band、以太网,到底谁更适合AI工作负载?如果在以前,答案大概率是InfiniB and,但是现在,以太网 也逐渐走进了AI应用场景。Dell’Oro预测,由于人工智能的快速发展,相应的数据中心交换机的市场规模将扩大50%;目前,InfiniB and还处于领先地位,但是以太网“不甘落后”,预计到2027年其收入份额将增加20%,3年内更可能实现收入份额翻番。作为AI领域的“航标”,英伟达(NVIDIA)将会如何做出选择?据NVIDIA公布的财报显示,今年第一季度,公司又创下226亿美元的销售纪录,较上一季度增长23%,较去年同期更是大涨427%。网络业务的增长也是其中一个亮点。NVIDIA最新发布的适用于以太网的NVIDIA Spectrum-X800系列交换机,专门针对万亿参数级的GPU计算和AI基础设施进行了优化。在谈到Spectrum-X时,NVIDIA创始人兼首席执行官黄仁勋曾兴奋地表示,Spectrum-X开辟了全新的市场,能够帮助仅支持以太网的数据中心轻松接入大规模AI。NVIDIA Spectrum-X 以太网网络平台最新的好消息是,NVIDIA Spectrum-X网络平台刚刚荣获了COMPUTEX 2024颁发的“网络与通信类别奖”。据悉,Spectrum-X网络平台已经 量产。而英伟达未来也将继续加大在以太网领域的投入,一幅更完整的网络蓝图正在展开。以太网的又一次“新生”AI尤其是生成式AI的快速发展,对IT基础架构提出了更高的要求。之前,人们的注意力在很大程度上被算力、存力所吸引,其实在运力上,也就是网络方面,同样面临着新的挑战和机遇。归纳来说,AI对于网络的要求集中体现在以下几方面:更高的带宽——AI模型需要大量的数据用于训练,在训练过程中有大量的数据进行交互,这就要求网络必须具有更高的带宽,以便快速传输海量数据;更低的延迟——我们熟知的一些实时的AI应用,比如自动驾驶、机器人控制等,对网络延迟极其敏感,只有低延迟的网络才能够充分保证AI系统的实时响应能力;更高的可靠性——只有高度可靠的网络连接,才能保证数据的准确性和系统性能的稳定性;分布式的网络架构——对于需要跨多个GPU服务器、多个数据中心、甚至多个地理位置进行协作的AI系统,分布式网络架构可以提供更好的性能与可靠性;安全性保障——由于AI系统处理的数据可能包含敏感信息,因此网络需要提供更高级别的安全性,以防止数据泄露或被恶意攻击;高可扩展性——网络要具备灵活扩展的能力,以适应AI技术持续演进和业务不断变化的需求。作为一种成熟的网络技术,以太网络具备AI所要求的高带宽、低延迟、可靠性、易于管理和扩展等基本特性。而且经过多年的发展和演进,以太网的标准化程度和广泛兼容性得到了来自市场和用户层面的极大认可,再加上其成本效益、支持多种协议等优势,使得其在生成式AI时代又有了更多可以施展的空间。Spectrum-X领先以太网赛道Spectrum-X可谓NVIDIA在以太网络领域的“诚意之作”,它是全球首款专为AI打造的以太网网络平台,相较传统的以太网网络平台,将网络的性能提升了1.6倍。具体来看,Spectrum-X配备了NVIDIA Spectrum SN5600以太网交换机和NVIDIA BlueField® -3 SuperNIC,是一个兼顾了生成式AI云所需高性能和各种云功能的端到端平台。该平台通过动态路由技术和拥塞控制技术,实现了带宽的最大化和噪声隔离,为AI业务提供了最强性能的AI以太网网络,即使在同时运行数千个不同规模的AI作业时,也能够确保每个业务都能达到理想 的性能。特别值得一提的是,它与NVIDIA BlueField-3 DPU在南北向通信上相结合,可以支持先进的多租户云、GPU弹性计算和零信任安全。基于Spectrum-X,云服务提供商可以加快AI解决方案的开发和部署,获得更高的投资回报。黄仁勋在COMPUTEX主题演讲中表示,NVIDIA计划每年都推出新的 Spectrum-X产品,为客户提供更高的带宽、更多的端口和更加强大的软件功能集与可编程能力,以持续提高其领先的AI以太网网络性能。NVIDIA的网络在边缘智能、网络安全、AI工厂和超级计算等方面正不断释放其潜能。在生成式AI时代到来时,NVIDIA也敞开怀抱,将以太网络引入现代化数据中心,为AI打造更加坚实完善的运力底座。今天,Spectrum-X网络平台已经开始量产,并且成功应用于10万颗GPU的大型集群,这不仅证明了其自身的领先性和适用性,而且彰显了NVIDIA在网络技术领域的深厚实力,也预示着以太网数据中心在AI方面有很大潜力可挖。据了解,已经采用NVIDIA Spectrum-X的AI云服务提供商包括CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global和 Yotta等,他们的AI基础设施因此而获得了超强的网络性能。另外,继戴尔科技、慧与、联想和超微等将Spectrum-X平台整合到其产品中后,又有多家NVIDIA的合作伙伴也发布了基于Spectrum-X的产品,其中就包括永擎电子(ASRock Rack)、华硕(ASUS)、技嘉科技(GIGABYTE)、鸿佰科技(Ingrasys)、英业达(Inventec)、和硕(Pegatron)、云达科技(QCT)、纬创(Wistron)和纬颖科技(Wiwynn)等。对此,NVIDIA网络高级副总裁Gilad Shainer表示:“NVIDIA Spectrum-X是对以太网络的一次革命,它让企业能够充分利用其AI基础设施的强大力量来改变运营方式,甚至是颠覆其所在的行业。”以太网络已经成为NVIDIA新的业务增长点。显然,NVIDIA已经从技术、产品、市场和生态等方面,为迎接生成式AI带来的新一轮增长做好了准备。客户的选择,就是NVIDIA的选择我们注意到,当NVIDIA在发布面向以太网的NVIDIA Spectrum-X800的同时,也同步发布了NVIDIA Quantum-X800 InfiniBand网络,它们都是全球首批800Gb/s端到端吞吐量的网络平台,将计算与AI工作负载的网络性能提升到了一个更高的水平。云计算、大数据、AI、物联网等的兴起,要求网络在性能、可靠性、安全性、可扩展性、成本效益等方面有持续的提升。从NVIDIA网络当前的业务收入构成来看,InfiniBand网络还是重头,而以太网络则是NVIDIA为用户提供的又一种新的选择。从用户需求的角度出发,为其提供适合不同场景需求的产品和解决方案,这是所有IT厂商的明智之选,当然NVIDIA也不例外。面向生成式AI,打造强大的以太网网络,这是时代的选择,也是NVIDIA今后要重点发力的一个方向。往/期/回/顾从科技赋能到价值引领,东莞证券可进化的信创云建设启示录“智算”雄起 | 智算操作系统要“顶天立地”加速GPU,加速NVIDIA从开源角度看企业生成式AI落地之道打造生成式AI应用,从数据做起微信扫码关注该文公众号作者戳这里提交新闻线索和高质量文章给我们。来源: qq点击查看作者最近其他文章