走向光电共封时代，两大巨头发布 51.2T交换机芯片

2023-03-03 01:03

来源：内容来自半导体行业观察（ID：icbank）综合，谢谢。

在即将举办的OFC 2023，Broadcom 正在计划推出共同封装的光学器件。其中包括速度为 51.2Tbps 的新型 Broadcom Tomahawk 5 Bailly 芯片。由于需要降低数据中心内的比特/焦耳成本，同时提高速度和可靠性，共同封装的光开关被视为潜在的阶跃函数创新。这就是 Broadcom 的项目如此令人兴奋的原因。

这是OFC 2023发布的新型共封装光学芯片。这是一块Broadcom Tomahawk 5 51.2Tbps 交换芯片，板载八个 64 通道硅光子引擎。

这种新芯片能够以 5.5W 的功率为 800Gbps 的流量供电，减少了将信号驱动到交换机前端的可插拔光学器件的需要。对于某些参考框架，Tomahawk 4 Humboldt 25.6T 联合封装光学平台对于 800Gbps 链路的功率约为 6.4W。

我们在 2022 年 OCP 峰会上看到了 Broadcom Tomahawk 5。这里的主要进步是共同封装光学器件。移除可插拔光学器件的主要挑战之一是现状易于维护和改变。例如，如果需要更长的链路，可以插入更长距离的光学器件。对于较短距离的运行，可以使用DAC或AOC 。

我们已经看到英特尔和 AMD 等公司讨论了未来在芯片上共同封装光学器件的需求。

一段时间以来，我们一直在关注共同封装的光学领域。就在大流行关闭一切之前，我们偷偷溜进了英特尔实验室，观看了英特尔联合封装光学器件和硅光子开关的动手实践，尽管英特尔现在已经关闭了它的 Barefoot 单元。

业内大多数人都认为 CPO 开关甚至芯片间互连的节能将会实现。Broadcom 显然有一个战略，它正在其行业标准的交换芯片上执行，如 Tomahawk 系列。

对于那些想知道的人，我们在实验室中有一个传统的 25.6T 级交换机，我们几乎完成了对它的审查。除了用于交换机和 ConnectX-7 卡的 1500 美元光学模块之外，像这样的大型交换机中可插拔光学器件的绝对功耗是值得注意的。它清楚地说明了为什么我们将来需要 CPO 开关。最大的问题是我们什么时候会看到交叉。

Marvell Teralynx 10 宣布用于 51.2T 800GbE 交换

我们正处于交换机新时代的边缘。前文展示了基于 Broadcom Tomahawk 5 的 51.2T Bailly 联合封装光学交换机，以及今天发布的 Marvell Teralynx 10 交换机。这是另一款专为800GbE时代设计的51.2T交换机。

Marvell Teralynx 10 是一款更高性能的交换机芯片，具有 512 个 112G SerDes，用于高达 32 个 1.6Tbps 链路、64 个 800Gps 链路等。它还为平台带来了Flashlight telemetry,、programmable forwarding和其他 Teralynx 功能。由于它快四倍，因此可以拥有更快的网络或减少基数。Marvell 表示，这种四倍的性能取代了四个 12.8T 级交换机（例如我们之前看到的 32x 400GbE 交换机）。这是因为用于交换机到交换机上行链路的端口减少，以服务于相同数量的端口。

Teralynx 品牌来自 Marvell-Innovium 的收购。

Marvell表示，新平台将广泛部署的 12.8 Tbps 网络解决方案的带宽提高了四倍，由超低延迟Marvell Teralynx 10 51.2 Tbps交换芯片和业界首款 PAM4 1.6 Tbps 光电平台Marvell Nova组成。该技术使云数据中心运营商能够减少联网时间，最大限度地提高计算利用率，并满足人工智能和机器学习不断增长的带宽需求。

为了满足爆炸式增长的带宽需求，运营商需要升级到更高性能的网络解决方案，从而加快上市时间，同时降低每比特的成本和功耗。Marvell 的云优化 Teralynx 10 和 Nova 网络平台确保了交换机和光纤之间的互操作性，从而减轻了客户验证和互操作性测试的负担，并加速了这些下一代技术的部署。Nova 1.6 Tbps 平台可在 1RU 中实现 51.2 Tbps 交换，以提高云数据中心的带宽密度。

数据中心运营商面临着满足人工智能和机器学习等应用在云中推动的网络需求的挑战，”Marvell 汽车、相干 DSP 和 Switch 事业部执行副总裁 Nariman Yousefi 说。“为了满足这一需求，领先的运营商正计划直接从 12.8 Tbps 升级到 51.2 Tbps。利用业界延迟最低的可编程交换机 Teralynx 10 和业界首个 1.6 Tbps 光学平台 Nova，为数据中心运营商提供了一个云优化平台，以扩展和满足 AI/ML 应用程序不断增长的需求。”

“随着带宽需求以每年超过 50% 的速度增长，云数据中心运营商需要永无止境地努力大幅提高其运营的性能和能力，同时将设备成本、机架空间和功率保持在最低水平。以 51.2 Tbps 交换机和 200 Gbps/lambda 光学 PAM4 模块为基础的基础设施将成为下一个网络时代的黄金标准，”650 Group 的联合创始人 Alan Weckel 说。“Marvell 正在铺平一条有利于云及其客户的前进道路。”

eralynx 10 基于成熟的架构，是一款可编程的 51.2 Tbps 交换芯片，旨在处理高带宽工作负载。Teralynx 架构展示了 1.7 倍的延迟优势，使运营商能够减少花在网络上的时间并加快工作负载处理速度。此外，Teralynx 10 和 Nova 利用业界一流的 112G SerDes IP，可实现低成本、低功耗的系统设计。

Teralynx 10 的主要特性包括：多达 512 个 SerDes 通道，支持 25 Gbps、50 Gbps 和 100 Gbps I/O 速度，以支持广泛的交换机系统和连接；拥塞感知路由可最大限度地减少网络瓶颈和拥塞；可置换的灵活转发使运营商能够随着网络的发展对新的数据包转发协议进行编程；Teralynx 手电筒遥测（Flashlight telemetry）可提供全面的高级功能，包括支持 P4 带内网络遥测。

Nova 1.6 Tbps PAM4 电光平台由突破性的 200 Gbps/lambda 光学 DSP 提供支持，与当前解决方案相比，Nova 将光学带宽增加了一倍，同时将功耗和每比特成本降低了 30%。当今最高性能的 800 Gbps 光学模块基于 100 Gbps/lambda 光学带宽，这需要 64 个模块将数据移入和移出基于 51.2 Tbps 的交换机系统。使用 Nova，光学模块的数量可以减少一半，达到 32 个，每个模块的运行速度为 1.6 Tbps。此外，每个光学模块的光学元件数量减少了 50%，提高了模块可靠性，同时降低了制造复杂性和成本。

Marvell 表示，Teralynx 7 代交换机已出货约 500 万个 400GbE 端口。在 51.2T 一代中，我们将开始看到共同封装的光学器件和其他解决方案，使新的开关看起来与前几代产品有很大不同。Marvell 表示该芯片将在第二季度晚些时候提供样品，因此我们可能还有几个季度才能看到交换机中的 Teralynx 10，尤其是那些非超级缩放器可以购买的交换机。今天的 PCIe Gen5 速度仅支持 400GbE 链路。直到 2-3 年后的 PCIe Gen6，我们才有望看到 800GbE 甚至开始用于主流服务器和存储设备。因此，这些产品领先于大部分市场。

颠覆服务器芯片互联？4Tbps 光学I/O即将亮相

Ayar Labs 成立于 2015 年，致力于将光学作为推动更高互连速度和计算效率的手段。现在，该公司宣布计划在下周于圣地亚哥举行的光纤通信会议 (OFC) 上展示惊人的 4Tbps 光学解决方案。在接受HPCwire采访时，Ayar Labs 首席执行官 Charlie Wuischpard 称该解决方案为“[Ayar Labs] 商业级产品的全面实现”，并讨论了公司及其产品的未来。

但首先，一些技术细节。Ayar Labs 将演示的光学解决方案包括两个关键组件：SuperNova 激光光源和 TeraPHY 光学 I/O 芯片组。根据 Ayar Labs 的说法，每个 SuperNova 为八个光纤链路提供动力，每个链路又能够达到 256Gbps。这使您在每个方向上获得 2.048Tbps，或双向 4.096Tbps。该连接以近乎完美的精度运行（“1e-15 错误”，根据 Wuischpard 的说法）并且每位仅需要 5 皮焦耳的能量。据介绍，硬件主要由位于纽约州北部的 GlobalFoundries 制造。

“Chiplet”可能已经让您明白，Ayar Labs 的技术并非旨在取代系统级互连。“[人们]认为共同封装的光学器件意味着在以太网或 InfiniBand 网络中工作的东西，”Wuischpard 说。“我们真正在解决计算到计算或计算到内存的通信问题。” 作为更准确的比较，他引用了 Nvidia 的 NVLink 和 AMD 的 Infinity Fabric作为范例。

该产品的宣传很简单：互连的扩展速度与其他系统组件（如计算和内存硬件）不同。Wuischpard 说：“传输数据的功耗……正在以一种速度增长，即传输数据所消耗的能量超过计算该数据所消耗的能量。” 而且，正如 Ayar Labs 的头版标题（“通过光连接实现摩尔定律的下一阶段”）所表明的那样，其他领域的收益正在放缓，使得系统制造商和运营商在别处寻求收益。

就 Ayar Labs 而言，它正在加速满足这一需求。在过去的几年里，该公司一直在会议上展示其光学解决方案的更多元素和更快的连接，但听起来本月的公告可能是迄今为止最大的一次。“我认为我们展示的是商业级产品的完整实现，”Wuischpard 说，“而在此之前，我们随着时间的推移展示了它的子集。”

该公司还缓慢但稳步地开始运送其产品。

Wuischpard 说：“我们去年开始谈论我们产品的出货量，我们开始出货我们的前数百个单位——这既有小芯片也有激光器。” “这些将用于我们的客户正在建造的原型机中。”

“今年，因为我们对制造过程进行了鉴定，所以数量从数百增加到数千，”他补充道。“所以收入仍然有些微薄，但它们都处于大规模推出前的阶段。”

Wuischpard 说，这数千个单位将提供给大约 12 个客户，高于去年的“几个”。虽然其中大部分是私有的，但其他公司（如英特尔）则不是，Wuischpard 说 Ayar Labs 的投资者（包括 HPE、洛克希德马丁、英伟达等）提供了很好的提示。

“重要的是，它今天还没到，”Wuischpard 对冲道。“我们仍处于领先地位——我们开始为非常专业的项目限量发货。”

尽管如此，这位首席执行官仍认为该技术具有巨大的近期潜力，并指出在未来两到四年内，他预计收入将大幅增加。

“越来越多，你会看到所有主要的半导体厂商开始谈论光学 I/O 作为他们长期方向的一部分，”他说。“现在为未来开展的所有百亿亿次级或后百亿亿次级计划——无论是韩国、日本、欧洲还是美国的机器——都开始将这项技术视为可以适应这些领域的创新之一未来的高性能计算系统。......一旦你建立它们并在那个水平上降低它们的风险，它们往往会流入更广泛的市场。”

面对这些更大的机器，Wuischpard 特别指出，能源效率是一个驱动因素。

“在所有其他指标中，电源效率是这项技术的最大驱动力之一，因为如果你将它加到整个系统中，它就会对集群或数据中心的功耗产生巨大影响，”他说。“我认为第一个输入这个的人毫无疑问地赢得了 Green500，这没问题。”

Wuischpard 自然对 Ayar Labs 产品在这些应用中的实力充满信心。“相对于竞争对手，我认为没有人能接近，”他说。“我想你可能会看到人们谈论 400Gbps 解决方案、800Gbps 解决方案，也许还有 1.6Tbps 解决方案——但它们都受到尺寸、功率和延迟问题的困扰。”

“我们认为这次展会上会有人开始宣布看起来相似的东西——但他们可能不会展示他们解决方案的全部功能，”他补充道。Wuischpard 反复强调 Ayar Labs 希望在这个领域有公司，说“你不想成为那里唯一的人”，并将公开演示作为公司战略的一部分（“作为一种生态系统游戏，你不'想成为一家隐形公司”）。

为此，Ayar Labs 正在努力为多波长光源推出一项新的行业标准，Wuischpard 表示已经有 45 家不同的“顶级参与者”签署了该标准。当然，回到标题，Ayar Labs 将在下周的会议上演示其 4Tbps 解决方案，以及封装和光纤连接工艺的一些新进展（“将光纤连接到 CPU 封装中是前所未有的事情” )。

*免责声明：本文由作者原创。文章内容系作者个人观点，半导体行业观察转载仅为了传达一种不同的观点，不代表半导体行业观察对该观点赞同或支持，如果有任何异议，欢迎联系半导体行业观察。

今天是《半导体行业观察》为您分享的第3329内容，欢迎关注。