Redian新闻
>
PCIe必须紧随计算和网络步伐

PCIe必须紧随计算和网络步伐

公众号新闻

当系统架构师坐下来设计下一代平台时,他们首先会查看 CPU、加速器、内存、闪存、网络接口卡以及 PCI-Express 控制器和交换机供应商的路线规划图。在混合计算、内存型系统设计以及共享加速器内存等集群中,交换机变得越来越重要。


问题在于:即便如此路线规划图并没有真正协调一致。大多数 CPU 和 GPU 制造商都试图每两年进行一次重大的计算引擎升级,并在重大发布后再进行架构和流程调整,支撑产品销售。以太网和 InfiniBand 市场中的网络交换机、接口卡芯片也往往以两年为周期,并且在英特尔CPU 占据主导地位时,他们常常将产品发布与英特尔至强 CPU 的发布节奏紧密联系在一起。但这种节奏已被英特尔不断绘制的路线规划图、AMD CPU的重新崛起以及Arm CPU 制造商(包括至少三个超大规模制造商和云构建商)所打破。


然后是 PCI-Express 总线,它在过去二十年里无处不在。虽然近年来 PCI-Express 规范按照预期发布,但 PCI-Express 控制器一直忠实于 PCI-Express 路线规划图,但 PCI-Express 交换机在 MicroChip 和 Broadcom 的产品发布方面远远落后。


我们认为所有这些路线图都需要更好地协调一致。具体来说,我们认为控制 PCI-Express 规范并通过与 IT 行业广泛而深入的合作来实现这一目标的 PCI-SIG 组织需要加快步伐,采用两年的节奏,而不是平均的节奏在过去的二十年里,它已经展示了三项。虽然我们正在考虑这个问题,但我们认为短节奏地跳跃到 PCI-Express 7.0 会更好地为行业服务,需要尽快推出 PCI-Express 7.0,以使 I/O 带宽和通道数更好地与高吞吐量计算引擎,我们预计将越来越多地使用 PCI-Express 总线来处理基于 CXL 的分层和共享主内存。


我们调整了 PCI-SIG 的带宽图表,该图表并未显示 PCI-Express 6.0 规范是在 2022 年发布的,而是在 2021 年发布的,这是不正确的。


别误会我们的意思。我们很感激 PCI-SIG 组织,这是数据中心和现在边缘的各类公司之间的合作,自很晚的 PCI-Express 4.0 规范发布以来,已经能够使 PCI-Express 总线处于可预测的路线图上。2017 年交付。一些严峻的信号和材料挑战使数据中心在 PCI-Express 3.0 上停滞了七年,我们认为当时主导 CPU 的英特尔在提升 I/O 方面有点拖沓,因为它被“Sandy Bridge”Xeon E5s 使用的芯片组中的 SATA 端口烧毁,该芯片组于 2012 年 3 月发布,比预期晚。从那时起,关于将 PCI-Express 4.0 和 PCI-Express 5.0 控制器集成到处理器中的困难的传言就很多了。


一般来说,PCI-Express 规范发布后,大约一年左右的时间我们就会看到控制器嵌入到计算引擎和网络接口芯片中。因此,当 PCI-Express 4.0 在 2017 年问世时,我们看到第一批使用它的系统在 2018 年问世,具体来说,是IBM 基于 Power9 的 Power Systems 机器,随后在 2019 年 8 月推出的 AMD“Rome”Epyc 7002 中使用了它。英特尔直到2021 年 4 月的“Ice Lake”一代才将 PCI-Express 4.0 控制器纳入其 Xeon SP 处理器中。


即使在 2019 年短暂两年后就达到了 PCI-Express 5.0 规范,但直到2021 年 IBM 在其高端 Power E1080 机器中推出了 Power10 处理器,它才在产品中可用。AMD 直到2022 年 11 月推出“Genoa”Epyc 9004才将 PCI-Express 5.0 集成到服务器芯片中,英特尔直到 2023 年 1 月推出“Sapphire Rapids”Xeon SP 才将 PCI-Express 5.0 集成到服务器芯片中。


因此,正如 CPU 上的控制器所表达的那样,PCI-Express 4.0 和 5.0产品之间实际上是三年的节奏,即使规范只迈出了两年的一步。


我们认为规格和产品需要以更短的两年周期进行,以便计算引擎和互连可以全部排列在一起。其中还包括 PCI-Express 交换机 ASIC,传统上这些 ASIC 远远落后于广泛使用的 3.0、4.0 和 5.0 代 PCI-Express 规格。


在任何一代中,PCI-Express 端口和 PCI-Express 交换机之间的滞后都是一个问题。这种延迟迫使系统架构师在可组合性(理想情况下在 Pod 级别使用 PCI-Express 交换机)或带宽(通过直接服务器插槽提供)之间进行选择。系统和集群的设计需要兼具可组合性和带宽——我们也会在组合中添加高基数。


目前,只有两家 PCI-Express 交换机制造商:Broadcom(通过多年前收购 PLX Technologies)和 MicroChip。早在 2021 年 2 月,我们就对 PCI-Express 5.0 级别的 MicroChip Switchtec ASIC 进行了分析,其通道从 28 扩展到 100 个,端口从 16 扩展到 52 个,但据我们所知,它们尚未批量发货。Broadcom早在 2022 年 2 月就推出了 PCI-Express 5.0 芯片组合,其中包括 ExpressFabric PEX 89100 交换机,该交换机拥有 24 至 144 个通道和 24 至 72 个端口。截至发稿时,我们正在确认这些产品是否正在发货,但尚未收到博通的回复。


我们的观点是,PCI-Express交换机必须同时可用,计算服务器、内存服务器和存储服务器都将使用支持任何给定级别 PCI-Express 的芯片来创建。事实上,在第一天。您必须能够在服务器中嵌入交换机,并且不会丢失带宽或端口或牺牲基数来获得带宽。因此,我们需要大量供应商,以防其中一个供应商出现失误。这就是我们最近试图鼓励 Rambus 进入 PCI-Express 交换机 ASIC 市场的原因之一。


正如 PCI-SIG 推出 PCI-Express 7.0 规范的 0.3 版本一样,所有这些都是首要考虑因素。

让我们看一下一年前 PCI-Express 6.0 规范完成、PCI-Express 7.0 即将出现时我们对 PCI-Express 路线图所做的预测:



PCI-Express 7.0 规范预计要到 2025 年才会获得批准,这意味着我们要到 2026 年末或 2027 年初才能看到它出现在系统中。我们认为这个等待时间太长了。我们需要 PCI-Express 7.0 来提供带宽加速器,以处理运行模拟或训练 AI 模型所需的大量数据。我们需要它与完全复杂的 CXL 4.0 共享内存和池化内存规范相匹配。


我们知道,加速 PCI-Express 7.0 控制器和交换机的上市是很困难的,所有类型的产品也都必须加速。计算引擎和外围设备制造商都会犹豫是否要从 PCI-Express 6.0 产品周期中挤出尽可能多的投资。


尽管如此,随着 PCI-Express 6.0 投入产品并经过严格的测试(由于它使用了新的 PAM-4 信号和 FLIT 低延迟编码,因此需要进行严格的测试),我们认为该行业应该开始加速并尽可能与 CPU 和 GPU 路线图相匹配,并按照两年的节奏进行。


让各个组成部分保持平衡,然后同时共同前进。

来源:半导体行业观察

原文链接:

https://www.nextplatform.com/2023/07/07/pci-express-must-match-the-cadence-of-compute-engines-and-networks/


下载链接:
兆芯CPU+GPU技术路线解读
AI芯片、服务器、边缘域和Chiplet共舞(2023)
多领域(GPU CPU)散热材料工艺发展历史及路径演绎
AI围绕算力产业、国产化替代、复苏主线布局
CPU和GPU:异构计算的演进及发展
鸿蒙生态应用开发白皮书
2023年中国人工智能行业概览
70份GPU技术及白皮书汇总
新型GPU云桌面发展白皮书(2023)
GPU原理及在云桌面中的应用
兆芯CPU+GPU技术路线解读
大模型时代:智能设计的机遇和挑战(2023)
《AIGC行业深度报告系列合集》
《70+篇半导体行业“研究框架”合集》
290份重磅ChatGPT专业报告(全网最全)
《人工智能AI大模型技术合集》
《56份GPU技术及白皮书汇总》
《FPGA五问五答系列合集》
《机器人行业报告合集(2023)》

OrionX GPU AI算力资源池化技术白皮书

华为盘古大模型3.0发布,重塑千行百业

《集成电路及芯片知识汇总(2)》
9、芯片和芯片设计——集成电路设计科普 
10、集成电路EDA设计概述 
11、超大规模集成电路设计 
12、常用半导体器件讲解 
13、半导体制程简介 
14、SOC芯片设计 
15、ASIC芯片设计生产流程 
16、CAN总线详细讲解
《集成电路及芯片知识汇总(1)》
1、集成电路技术简介 
2、芯片设计实现介绍 
3、集成电路芯片设计 
4、芯片规划与设计 
5、数字IC芯片设计 
6、集成电路设计的现状与未来 
7、集成电路基础知识 
8、集成电路版图设计

申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。


推荐阅读

更多架构相关技术知识总结请参考“架构师技术全店资料打包汇总(全)(39本全)”相关电子书已经更新至39本,持续更新中。
1、下单“架构师技术全店资料打包汇总(全)”,包含服务器基础知识全解(终极版)pdf及ppt版本,价格仅收239元(原总价399元)。

2、随着电子书数量增加及内容更新,价格会随之增加,所以现在下单最划算,购买后续可享全店内容更新“免费”赠阅。

温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一招教你12小时背下4000个DSE必考单词!!TikTok的兴趣电商与Shopee必有一战​2022年北京市广播电视和网络视听行业总收入4738.47亿元赶due必备!英国超市速食带你快速搞定一顿饭!美国网红博主因虐儿指控被逮捕和封号,家人和网友:早就应该被抓了!日本一小哥打算和女友结婚,独自拜访岳父母!刚一进家门,就被吓到怀疑人生...躺平的诉求征稿 | 2023年IEEE 信号处理、通信和计算国际会议 (ICSPCC 2023)科学家建立中国体量最大的无机材料数据库,用高通量计算和数据加速新材料发现工业和信息化部圆满完成成都大运会开幕式无线电安全、信息通信服务和网络安全保障任务被“挖呀挖”颠覆的流量和网红【经济】法国手机和网络资费普涨,大批客户流失步伐不减反增!富途一季度净利翻倍,港股IPO承销第一你鼓舞了我——冷明后悔!女大学生视力突然下降,到医院一查,竟和网购的这个东西有关……残余缺血可增加PCI后左主干分叉病变患者的心血管死亡风险,可行μQFR评估| EuroPCR 中国之声有了超算和大模型,就能预测任何一场气象灾害了?国内的食品在K-town,当然要和网红博主做邻居啦!【提示】聚焦网络谣言、网络暴力等网络乱象,上海警方多措并举维护清朗有序网络环境DevOps 是否已死?AI 和大语言模型给云计算和 DevOps 带来了哪些影响?|InfoQ 趋势报告曾经的厅官网信办等部门关于调整《网络关键设备和网络安全专用产品目录》的公告美国网红把自己做成AI,和网友恋爱月入百万。结果AI失控,狂说虎狼之词8大道华人发出怒吼!“联邦政府必须拿出资金,也必须让我们的声音更大,如此我们的声音才能被听到,我们也必须继续这场战斗!”PCI后μQFR可有效预测2年靶血管失败率 | EuroPCR 中国之声超幸运, 加拿大又有华人中彩票大奖! 打算和丈夫环游世界~租房子要如何开通燃气、电和网?最详尽的开帐户步骤攻略!【2023无忧生活攻略】关于沪深300指数底部的测算和底部定价权澳洲这款纽扣电池紧急召回!恐致窒息、灼伤甚至死亡,多家商店和网上有售网红育儿博主因虐儿指控被逮捕和封号,家人和网友:早就应该被抓了!AlphaDev突破十年算法瓶颈登上Nature,GPT-4紧随其后两步破解 |【经纬低调出品】紧随Netfilx脚步,Costco开始打击“会员分享”!“美国海军第一,中国紧随其后”双声子 鹰啸
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。