硅光互联,可以怎么玩?
来源:内容来自半导体行业观察(ID:icbank)综合,谢谢。
正在开发的硅光子技术并不缺乏,每隔几个月,似乎就会有另一家初创公司出现,承诺在更长的距离上提供大带宽,同时使用比铜互连更少的功率。
Celestial AI 是进入这一领域的最新竞争者,在经历了一年多的沉寂后,它又重新崛起,手上又获得了 1 亿美元的资金,他们声称这是一种新型的硅光子互连,涵盖了从芯片到芯片的整个领域。芯片、封装到封装以及节点到节点的连接。
需要明确的是,我们过去曾从其他硅光子初创公司那里听到过类似的说法,尽管大多数公司在他们试图解决的问题上更加保守。例如,Lightmatter 正在寻求使用其Passage光学内插器将需要带宽的芯片(例如交换机 ASIC)拼接在一起。与此同时,Ayar Labs 正在寻求使用其 TeraPhy I/O 小芯片来解决封装外光学问题。
尽管有任何相似之处,但这并没有阻止 Celestial 赢得一些重量级投资者的青睐,包括 IAG Capital Partners、Koch Disruptive Technologies (KDT) 和淡马锡 Xora Innovation 基金。该公司还吸引了 Broadcom 的兴趣,Broadcom 正在帮助开发基于其设计的原型,Celestial AI 首席执行官 Dave Lazovsky 告诉 Next Platform,从开发到交付给客户,大约需要 18 个月。
当 Celestial 去年年初首次出现时,该公司专注于构建名为 Orion 的人工智能加速器,该加速器将采用光学互连技术。从那时起,该公司的重点已转向向芯片制造商授权其光子结构,尽管拉佐夫斯基表示该公司仍在研究Orion。
说到底层技术,Celestial Photonic Fabric 基于硅光子学和先进 CMOS 技术的结合,与 Broadcom 合作设计,采用台积电的 4 纳米和 5 纳米工艺技术。
最先进的互连形式涉及在光学中介层上堆叠第三方 ASIC 或 SoC,或使用该公司的光学多芯片互连桥 (OMIB) 封装技术在芯片之间传输数据。对我们来说,这听起来很像 Lightmatter 在 Passage 上所做的事情,我们不久前看过,但 Lazovsky 坚持认为 Celestial 的技术效率要高几个数量级,并且可以轻松支持数百瓦的热量。事实是否如此,我们还需拭目以待。
对于初始设计,Celestial 的 Photonic Fabric 使用 56 Gb/秒 SerDes。该公司表示,每个节点有四个端口,每个端口有四个通道,每平方毫米可以达到约 1.8 Tb/秒。Lazovsky 声称:“如果您想互连到四元组(一个模块中的四个 HBM 堆栈),我们可以轻松匹配完整的 HBM3 带宽。”
对于其第二代光子结构,Celestial 正在转向 112 Gb/秒 SerDes,并将通道数量从 4 个增加到 8 个,有效地将带宽增加四倍,达到每 mm 2 7.2 Tb/秒。
但是,正如您所料,此类事情的进入门槛相当高。要提取 Celestial 的光子结构提供的最大带宽,意味着在设计芯片时要考虑到该公司的光学中介层或 OMIB。根据 Lazovsky 的说法,这本质上需要用自己的技术替换现有的 PHY。尽管如此,互连并不依赖于专有协议(尽管它可以与这些协议配合使用),而是在设计时考虑了 Compute Express Link (CXL)、Universal Chiplet Interconnect Express (UCIe)、PCIe 和 JEDEC HBM。
即使 Lazovsky 自己承认“看起来与 Ayar Labs 的TeraPHY非常相似”,Photonic Fabric 也可以部署为小芯片以及 PCI-Express 附加卡。PCI-Express 可以说是最实用的,因为它不需要芯片制造商重新架构其芯片来支持 Celestial 的内插器,也不需要依赖尚处于萌芽阶段的UCIe 协议来实现小芯片到小芯片的通信。
PCI-Express 的缺点是它是一个非常大的瓶颈。虽然 Celestial 的光学器件能够提供海量带宽,但 X16 PCI-Express 5.0 接口的每个方向的最大速度约为 64 GB/秒。如果我们不得不猜测,这个选项确实存在作为概念证明,让客户熟悉这项技术。
Lazovsky 声称,该小芯片架构能够提供更高的带宽,但仍然受到约 14.4 Tb/秒的 UCIe 接口的瓶颈。我们会注意到,UCIe 在准备好进入黄金时段之前还有很长的路要走,但听起来小芯片也可以与芯片制造商的专有结构一起使用。
当然,此类光学互连面临的挑战并没有改变。除非您对带宽的迫切需求远远超出了使用铜线所能达到的范围,否则有大量现有且经过充分测试的技术可用于将小芯片物理拼接在一起。台积电的 CoWoS 封装技术只是一个例子。
然而,在更长的距离上,甚至在封装之间,光学器件开始变得更有意义,特别是在带宽敏感的 HPC 和面向 AI/ML 的工作负载中。这是 Celestial 看到的光子结构的首批实际用例之一。
Lazovsky 表示,由于互连支持 Compute Express Link (CXL),因此它可以用于共享 HBM3 内存。
这个概念类似于我们过去详细讨论过的CXL 内存池。这个想法是,多个主机可以像连接到共享存储服务器一样连接到内存设备。由于 HBM 具有惊人的内存带宽(高达 819 GB/秒),它最多可以放置在距离芯片几毫米的地方。
对于那些训练大型语言模型的人来说,这可能会有点痛苦,因为在 Nvidia 的 H100 或 AMD 的 MI250X 等加速器上发现的内存与计算的比例是固定的。为了获得适量的其中一项(例如内存),可能意味着要为另一项付出比您实际需要更多的费用。
Celestial 声称,如果正确实施,其 Photonic Fabric 可以实现足够的带宽,不仅可以远距离支持 HBM3,而且最终可以在多个加速器之间池化内存。
“通过构建光学互连的 HBM 模块,它改变了游戏规则,”Lazovsky 说。“如果不再需要随内存一起扩展计算,那么相同内存容量的成本可能会降低 20%。”
因此,也许这就是杀手级应用程序,它不仅将使光学互连无处不在,而且还将可组合基础设施带入主流。
与此同时,Lightelligence 也打算利用全球首款光片上网络处理器彻底改变了大数据互连。
Lightelligence有望改变半导体行业
光子计算领域的全球领导者Lightelligence今天推出了新的大数据互连范例,推出了全球首款专为以下领域设计的片上光网络 (oNOC) 处理器 Hummingbird:特定的人工智能 (AI) 工作负载。
Hummingbird 采用先进的垂直堆叠封装技术,将光子芯片和电子芯片集成到一个封装中,作为数据中心和其他高性能应用的通信网络。Hummingbird 的首次公开演示将于 8 月 27 日至 29 日在斯坦福大学举行的 Hot Chips 活动上进行。
Lightelligence 首席执行官表示:“光子学是解决关键计算扩展问题的解决方案,随着传统解决方案难以跟上人工智能行业突破所刺激的计算能力需求呈指数级增长,这一问题变得越来越紧迫。” “Hummingbird 展示了该行业如何通过将光子技术融入其下一代产品来解决扩展问题。”
SemiAnalysis首席分析师 Dylan Patel 补充道:“Lightelligence 正在利用其专有的光子技术打破内存壁垒,这可能会彻底改变半导体行业。”
Hummingbird 是 Lightelligence 光子计算产品组合中的第二款产品。其光子算术计算引擎 (PACE) 平台于 2021 年末发布,利用定制 3D 封装和无缝协同设计,将光子学和电子学完全集成在一个小外形尺寸中。
Hummingbird 是利用 Lightelligence 的 oNOC 平台的产品系列中的第一个产品,该平台通过硅光子学实现创新的互连拓扑,从而显著提高了计算性能。其波导以光速传播信号,并利用到 64 核特定领域 AI 处理器芯片上每个核心的全对全数据广播网络,使 Hummingbird 在延迟和功耗降低方面比传统数字互连解决方案具有显着优势。
计算扩展挑战激发了光学互连解决方案的创建。与数字网络不同,Hummingbird 的 oNOC 技术通过启用原本无法实现的互连拓扑来提高密度扩展。
在 oNOC 中,功耗和延迟几乎不受距离影响,这使得该技术非常适合开发不依赖最近邻居通信的新的、更强大的拓扑。像蜂鸟这样的 oNOC 拓扑由于更高效的通信,即使在单个电子 IC 配置中也能实现更高的计算能力利用率。借助 oNOC,将工作负载映射到硬件变得更加容易,并为计算任务选择正确的拓扑提供了更大的自由度。
在 Hummingbird 中,Lightelligence 实施了跨 64 个核心的低延迟光学全对全广播网络。Hummingbird 拥有 64 个发射器和 512 个接收器,提供了实现各种密集光网络拓扑的框架。
Hummingbird 的电子和光子 IC 共同封装并集成到 PCIe 外形尺寸中,可安装在行业标准服务器中。与 Lightelligence 软件开发套件 (SDK) 相结合,可以优化机器学习和人工智能工作负载,以充分利用 oNOC。oNOC 和 Hummingbird IP 还可以针对其他独特的工作负载和应用程序进行定制。
据介绍,未来几代的Hummingbird将采用十字线缝合(reticle-stitching)来支持小芯片架构,以实现更好的可扩展性、提高能源效率并进一步减少瓶颈。
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第3448期内容,欢迎关注。
推荐阅读
半导体行业观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回复下方关键词,阅读更多
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
回复 投稿,看《如何成为“半导体行业观察”的一员 》
回复 搜索,还能轻松找到其他你感兴趣的文章!
微信扫码关注该文公众号作者