Redian新闻
>
向InfiniBand发起冲击

向InfiniBand发起冲击

公众号新闻

👆如果您希望可以时常见面,欢迎标星🌟收藏哦~

来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢。

作为Ultra以太网联盟的创始成员,该联盟的明确目标是使以太网与InfiniBand一样适合AI和HPC集群,但凭借以太网的可扩展性和熟悉度,Arista Networks希望从世界各地的企业数据中心的即将到来的AI浪潮中获得巨大利益。它还希望扩大其在两个最大客户(微软和Meta平台)中的网络钱包份额,并利用这些大客户为数千家想要模仿微软和Meta的企业商店打开大门并完成交易。当谈到人工智能时,平台就是这样做的。


Broadcom 对其人工智能调整的“Jericho3-AI”交换机 ASIC 充满热情,而且 Microsoft、Meta Platforms 和 Broadcom 也是 UEC 的创始成员,这并没有什么坏处。


一切都安排得很好,Arista 可以通过将 AI 网络纳入主流而从中受益匪浅,本质上是让 Broadcom ASIC 及其自己的 EOS 网络操作系统堆栈与Cisco Systems 的 Silicon One ASIC 及其自己的交换机以及超大规模提供商和云构建商可能的交换机进行竞争。基于这些开关芯片制作。哦,两者都在瞄准 Nvidia 的 InfiniBand,该技术在支持 GenAI 和其他类型机器学习的集群上的计算节点互连方面占有最大份额。即使是 InfiniBand 也必须拥有一个由400 Gb/秒以太网和 BlueField DPU 组合而成的 Spectrum-X 的备份计划。


Nvidia 联合创始人兼首席执行官黄仁勋 (Jensen Huang) 打趣道,InfiniBand 网络约占 AI 集群成本的 20%,并且性能比现有以太网交换(不是 Spectrum-X)提高了约 20%,因此 InfiniBand是有效免费,但数学上没那么快。InfiniBand 可能会收回成本,而 Spectrum-X 可能会缩小普通以太网和 InfiniBand 之间的人工智能网络差距,但它肯定不是免费的。您仍然需要拿出钱购买 InfiniBand,以从集群中的 Nvidia GPU 中榨取额外的性能。这可能是很多钱。


英伟达的财务状况给了我们一个提示。在截至 1 月份的过去 12 个月中,我们的模型显示 Nvidia 的数据中心计算销售额(即 GPU、少量 CPU、HGX 和 MDX GPU 组件以及 DGX 服务器)为 259.7 亿美元,而 InfiniBand 销售额为 55.3 亿美元。与前 12 个月相比,这 12 个月中数据中心计算销售额增长了 2.4 倍,InfiniBand 增长了 3.15 倍。以太网销量实际上下降了,我们认为 Arista 和思科在超大规模提供商和云构建商中蚕食了 Nvidia 的以太网业务,也许唯一的原因是这些大公司不喜欢集中其供应链风险。


但还不止于此。InfiniBand 需要比以太网更多的交换机才能扩展到 10,000 个或更多节点。人们对此争论不休。有人说 InfiniBand 最多可容纳约 11,000 个节点(或 GPU 设备,如果每个 GPU 有一个网络接口,就像 AI 集群那样),有人说最多可容纳 40,000 个节点(或 GPIU 设备)。据 UEC 称,公司正在考虑建立拥有 50,000 至 100,000 个加速器的培训集群,用于培训并关注 100 万台设备。超大规模企业和云构建商一直不情愿地愿意接受人工智能集群的非以太网网络,正如我们之前指出的,微软很早就很渴望并为 InfiniBand 提供了一些它所缺少的多租户和安全功能,是以太网的一部分。但我们认为,微软和 Meta Platforms 或任何其他大规模运营 AI 的公司都不会愿意为 InfiniBand 支付 20% 的溢价,因为历史上他们能够以低于集群成本 10% 的成本拥有以太网网络。


将网络成本削减一半以上意味着每个人工智能集群都可以进一步扩展,因为节省的网络成本可以重新投入到计算中。这就是世界各地 HPC 中心多年来的运作方式。


考虑到我们已经看到并拆解的所有关于人工智能支出的预测,这里有一个关于 GenAI 支出的预测,特别是 2022 年到 2027 年之间的支出,这是一个对 2015 年到 2027 年数据中心 GPU 支出进行建模的预测,这是一个对 2015 年到 2027 年数据中心 GPU 支出进行建模的预测,这是一个预测该模型基于 2022 年至 2027 年的 IDC 数据对人工智能和非人工智能服务器支出进行了建模,这里还有一个对AMD 到 2027 年人工智能加速器支出达到 4000 亿美元的雄心勃勃的预测进行剖析的结果。


因此,当 Arista 联合创始人兼首席执行官 Jayshree Ullal 在与华尔街分析师讨论该公司 2023 年第四季度财务状况的电话会议上表示,该公司坚持其人工智能领域(相对而言)仅为 7.5 亿美元的预测。到 2025 年,我们的头会像狗听到高亢的口哨声时那样倾斜。考虑到我们预测的人工智能总体支出的增长,这似乎有点低。


当然,对于大型集群,InfiniBand 的价格可能是以太网的两倍,但只要您的集群与世界上传统 HPC 系统一样处于 InfiniBand 规模的最佳位置,它就会产生更低的延迟,从而提高 GPU 利用率。因此,对于相同数量的集群,您可能会认为网络部分会下降,因为公司决定切换到以太网,为此他们可能会为了节省或扩大计算和网络规模而牺牲一些延迟。


让我们做一些数学计算。如果人工智能服务器要推动 1000 亿美元的加速器销售额,那么系统销售额将达到约 2000 亿美元。再加上 200 亿美元的以太网网络和 300 亿美元的闪存存储,网络约占 AI 服务器 TAM 总量的 8%。相对于这一合理的估计(不包括在 CPU 上运行的推理,这将成为市场的重要组成部分),考虑到 Arista 在 10 Gb/秒及更高速度的数据中心交换机收入中占据约 30% 的份额,到 2025 年 7.5 亿美元似乎很小速度。


看来,很大程度上取决于统考委员会的工作以及其工作速度。


但预测是好的,乌拉尔给出了一些统计数据,以支持在人工智能网络方面采取更积极的立场,如果这种最初的轶事证据被证明是一种趋势的话。


“如果我看看去年,可能是过去十二个月,这是一个更好的迹象,”乌拉尔在电话会议上解释道。“我们参与了大量的人工智能投标。当我说“大”时,我应该说它们是大型人工智能出价,但更清楚地说,它们实际上是一小部分客户。在我们参加的以太网与 InfiniBand 上的 5 个 AI 网络集群中的最后 4 个中,Arista 赢得了以太网的全部 4 个集群,其中一个仍然停留在 InfiniBand 上。所以这些都是非常知名的客户。我们对这一进展感到高兴。但正如我之前所说,去年是考验的一年。今年是飞行员年。真正的生产将于 2025 年开始。”


我们的模型基于预感和一个数据点,即 Arista 在 2023 年的人工智能相关网络销售额可能为 2.35 亿美元,这一数字增长了 28.5%,达到 3.02 亿美元。今年,这一数字可能会达到 3.87 亿美元,到 2025 年将达到 7.5 亿美元。我们预计 Arista 会在 2025 年看到更大的上涨空间,但它并不是唯一一家希望利用人工智能和其他技术的以太网供应商取决于其 ASIC 选择以及它们如何随时间演变。我们认为,当 Arista 使用 Cisco Silicon One ASIC 时,这将是地狱般寒冷的一天。



接下来,让我们深入研究 Arista 2023 年第四季度的数据。


今年最后一个季度,Arista 的产品收入增长了 19.5%,达到 13.1 亿美元,服务收入增长了 28.8%,达到 2.301 亿美元。


总收入增长 20.8%,达到创纪录的 15.4 亿美元。软件订阅收入为 3180 万美元,增长 38.9%,软件和其他订阅收入增长 29.9%,达到 2.619 亿美元。


该季度营业收入为 6.4 亿美元,净利润为 6.14 亿美元,占收入的 39.8%。营业收入和净利润的增长速度都是收入的两倍左右,这是科技公司希望看到的情况。



下表显示了十多年来 Arista 每年的所有关键指标,包括 Microsoft 和 Meta Platforms 作为主要客户的崛起:



大多数科技公司应该按年度而不是按季度进行评估,这是一个自然波动的业务,第一和第三季度表现疲软,第二季度相对强劲,而数据中心的第四季度通常表现强劲。


全年产品销售额增长 35.3%,达到 50.3 亿美元,服务收入增长 24.9%,达到 8.31 亿美元,总销售额达 58.6 亿美元,增长 33.8%。IT 市场除了 AI 服务器支出之外,还正在经历服务器衰退,超大规模提供商和云构建商也将在 2023 年削减支出。2023 年,该公司实现净利润 20.9 亿美元,增长 54.3%,占收入的 35.6%。这是一个非常健康的净利润与收入比率。Arista 年底现金略多于 50 亿美元,这给了它足够的空间来进行战略性人工智能和其他它认为必要的收购,甚至如果有一天需要的话,甚至可以创建自己的 ASIC。我们认为 Arista 在今年年底拥有超过 10,000 名客户,并且我们知道其 CloudVision 遥测软件拥有超过 2,400 名客户。


Arista 只在每年年底告诉我们有关其最大客户的详细信息(这些客户在任何特定时期内占收入的 10% 以上),因此我们现在可以讨论这一点。Microsoft 和 Meta Platforms 正在大力推动以太网通过 UEC 发展,分别占 2023 年销售额的 21% 和 18%。微软的收入为 12.3 亿美元,比去年增长 75.6%;Meta Platforms 的收入为 10.6 亿美元,实际上下降了 5.6%。


我们不知道两家公司有多少支出用于人工智能集群或通用数据中心互连,但显然大部分支出不是用于人工智能,否则 Arista 会对此发表评论,因为这对业务和美国证券都很重要交易委员会不喜欢不向股东报告重大事项。(这也是为什么占收入超过 10% 的客户也必须披露的原因。这是 SEC 的规则,而不是仁慈。)


与 Arista 对 Microsoft 和元平台的销售一样令人印象深刻,对普通企业的销售增长(主要是数据中心,但我们认为,同伴园区和边缘网络的销售也越来越多)为 Arista 提供了一个新的成长载体。


下面是我们的表格,显示了过去三年按客户类型和产品类型划分的 Arista 销售额明细,该表格由公司声明得出,并由The Next Platform填补或估计空白:



2023 年,Arista 的云Titans(我们称之为超大规模提供商和云构建商)的增长乏力,增长速度仅为 2022 年的五分之一,但仍好于 2020 年的可怜增长,因为 Meta Platforms 决定跳过其网络中的 200 Gb/秒以太网一代。


Cloud Titans 仍然是 Arista 最大的客户群体,销售额达 25.2 亿美元,增长 25%。服务提供商的增长率大致相同(从 2022 年起增长 27.7%),达到 12.3 亿美元。但随着 Arista 减少积压订单,企业和金融客户在 2023 年实现了 50.5% 的增长率,而且越来越多的此类客户(其中许多人正在构建他们的下一个平台)寻求超大规模提供商和云构建商在他们选择 Arista 来供应交换机,有时还供应路由器。我们将看到 2024 年超大规模企业和云构建商的增长是否能够超过企业和金融领域的发展。我们认为企业希望将以太网用于其人工智能集群,因为它们无法吸收和管理像 InfiniBand 这样不同的东西,所以不要将后者排除在外。到 2024 年并进入 2025 年。50,000 名客户的合理份额的购买量应超过 8 名客户的购买量。


当您对 Arista 所说和一直在谈论其产品的内容进行数学计算时,您会发现路由变得与园区一样重要,这给 Cisco 和 Juniper Networks 带来了压力(如果价值 350 亿美元,很快就会成为 Hewlett Packard Enterprise 的一部分)交易发生)。据我们所知,边缘已经成为 Arista 业务的重要组成部分,考虑到 HPE 从收购 Aruba 中获得的巨大成功和利润,Arista 大力推进园区无线网络也就不足为奇了。几年前。正如我们上面所暗示的,出于正确的动机 - 假设 Broadcom 开始对其 ASIC 收取过高的费用,或者 Arista 认为需要一种能够像 Cisco 展示的 Silicon One 芯片一样出色地完成交换和路由的 ASIC – 如果 Arista 组建一个团队来创建定制 ASIC,请不要感到惊讶。一旦 Arista 变得足够大,拥有这种控制力将变得非常有吸引力。


Arista没有人提出这是计划,公司的高层今天可能会嘲笑这个想法。


那又怎么样?Andy Bechtolsheim创建了Sparc架构,他足够富有,可以在他想做的任何时候做任何他想做的事情。


原文链接

https://www.nextplatform.com/2024/02/13/arista-networks-conservatively-awaits-its-ai-boom/

点这里👆加关注,锁定更多原创内容

END


*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第3675期内容,欢迎关注。


推荐阅读


EUV光刻机重磅报告,美国发布

碳化硅“狂飙”:追赶、内卷、替代

芯片巨头,都想“干掉”工程师!

苹果,玩转先进封装

GPU的历史性时刻!

大陆集团,开发7nm芯片

张忠谋最新采访:中国会找到反击方法

EUV光刻的新“救星”

『半导体第一垂直媒体』

实时 专业 原创 深度

公众号ID:icbank


喜欢我们的内容就点“在看”分享给小伙伴哦

微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
斯坦福机器人炒虾爆火网络,谷歌DeepMind发布机器人最新进展,2024智能机器人元年到来?Wetlands Project Suspended After NGO Lawsuit《再见,布里诺斯艾利斯》“多巴胺”的“胺”不读ān?寒假最后一波遛娃!跟市长一起滑冰、Wonderland冬季打卡倒计时!应该说what kind of还是what kinds of?“多巴胺”的“胺”应读为àn,“2023年十大语文差错”发布嫉妒的心灵不美丽InfiniBand,撼动不了以太网?突发!龙年生肖钞币“2秒抢空”?!银行排队竟起冲突!送礼收藏都很赞!hé bàng?hé bèng?为“保护五星红旗”,中国女生国外与老外钢琴家起冲突!当事人这样说...澳CBD发生严重车祸!男子遭2次撞击生命垂危,事发路段已关闭两首《万家灯火》钢琴家伦敦街头直播与中国人起冲突,当事女生还原事情真相InfiniBand与RoCE对比分析:AI数据中心网络选择指南芝大等七校RD发榜,CMU/芝大/圣母录取惨淡,三名校录取总量高于去年...华人在伦敦与英国钢琴家起冲突,究竟怎么回事反转!钢琴家伦敦街头直播与中国人起冲突,当事女生还原事情真相!眼见不一定为实法拉盛男子被刺2刀!凌晨夜总会起冲突 嫌疑人仍未被捕谷歌DeepMind发布三项机器人研究成果;传苹果将在WWDC发布生成式AI版本Siri丨AIGC日报澳CBD发生枪击案,3人受伤!2人被捕,1人仍在逃dá àn jiē xiǎo 🥳J Mol Biol | 清华大学李海涛/高军涛合作揭示SPINDOC 衰减Spindlin1转录共激活作用的分子机制2023虽然过的不尽人意但是也要总结一下!澳洲路怒事件,两男子起冲突,1人被捅伤!双双送医悉尼路怒事件,两男子起冲突,1人被捅伤!双双送医海莉向特朗普发起最后冲击当天发货!龙年生肖钞币“2秒抢空”?!银行排队竟起冲突!悲剧!悉尼发生火车撞人事故,1男1女当场死亡!死者身份确认!事故原因竟是因为…Burwood发生跳轨自杀事件英国钢琴家在伦敦街头直播与中国人起冲突!当事女生站出来,还原整个事情真相关于朱令铊中毒的一点讨论博通、AMD和英特尔等联手,要打破InfiniBand垄断一文了解InfiniBand和RoCE网络技术突发!龙年生肖钞币“2秒抢空”?!银行排队竟起冲突!
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。