Redian新闻
>
CXL:破解AI时代“内存墙”新途径

CXL:破解AI时代“内存墙”新途径

公众号新闻

AI大模型的快速发展推动“算力”和“存力”需求快速增长,“内存墙”问题由来已久,在 AI 时代表现的愈发明显,“算力”和“运力”之间的差距越来越大。Transformer 类的模型参数的数量呈现指数增长,每两年增加 410 倍,而 GPU 内存仅以每两年 2 倍的速度扩展。

1、AI时代“内存墙”问题愈发明显

AI 大模型的快速发展推动“算力”和“存力”需求快速增长,与此同时,对“运力”也提出了更高的需求。“运力”是指在计算和存储之间传输数据的能力,AI 时代,系统需要更大的运力,需要更高的带宽、更快的传输。

“内存墙”问题由来已久,在 AI 时代表现的愈发明显,“算力”和“运力”之间的差距越来越大。“内存墙”指内存的性能提升速度远低于处理器的性能提升速度,从而导致处理器无法充分发挥其计算能力。由于内存的读写速度相对较慢,处理器在等待数据从内存中读取或写入时会出现空闲状态,从而限制了系统的性能,即使增加处理器数量和核数,也无法有效提高整体的计算能力。Transformer 类的模型参数的数量呈现指数增长,每两年增加 410 倍,而 GPU 内存仅以每两年 2 倍的速度扩展。

2、CXL 高速互联应运而生,提高内存利用效率

CXL(Compute Express Link)技术是一种新型的高速互联技术,旨在提供更高的数据吞吐量和更低的延迟,同时实现内存共享、提高内存利用效率,为化解“内存墙”问题提出新的解决方案。它最初由英特尔、AMD 和其他公司联合推出,并得到了包括谷歌、微软等公司在内的大量支持。CXL 的目标主要是为了解决 CPU 和设备、设备和设备之间的内存鸿沟,解决内存分割造成的较大浪费、不便和性能下降。CXL 通过将计算和存储分离,形成内存池,从而能动态按需配置内存资源,提升效率。

3、CXL 技术优势明显

与 PCIe 技术相比,CXL 技术具有优势。1)CXL 延迟较低,通常为 10ns,而 PCIe的延迟为 100ns。2)CXL 支持内存一致性,一致性的缺乏限制了 PCIe 应用程序。3)CXL 地址空间可按定义缓存,PCIe 地址空间通常不可缓存。但相较于 PCIe 庞大且成熟的生态系统,CXL 目前应用并不广泛,仍有广阔的发展空间。

4、CXL 版本持续升级迭代

CXL 历经 5 个版本的升级发展,内存共享和设备的灵活性增强。CXL1.0 于 2019年 3 月发布,后历经 1.1、2.0、3.0 版本,2023 年 11 月,CXL 联盟发布了最新的CXL3.1 版本。随着 CXL 技术的不断演进,未来数据中心各个计算节点和内存节点的互联将更加快速、高效和灵活。

CXL1.0 及 1.1 版本归为一代标准,二者相比并没有较大的区别。CXL2.0 发布于2020 年,新增了切换、内存池化、按需内存分配、IDE(完整性和数据加密)功能。

CXL3.0 版本在三个关键领域进行重大改进。1)PCIe 协议由 PCIe5.0 上升到PCIe6.0,传输速率由 32GT/s 提升至 64GT/s;2)CXL3.0 可以支持更加灵活的 Switch拓扑;3)除了支持内存池化,CXL3.0 还进一步支持内存共享。

CXL3.1 新版本对横向扩展 CXL 进行了结构改进、增加了新的可信执行环境功能,并对内存扩展器进行了改进。1)支持使用全局集成内存(GIM)通过 CXL 结构进行主机间的通信,这可以大大提高系统性能。2)通过 CXL 对内存事务的直接点对点支持来增加 GPU 内存的使用效率,这对于处理大规模数据集和 AI 工作负载非常有帮助。

5、国际巨头纷纷加入CXL联盟

CXL 联盟由英特尔牵头成立,目前成员已经超过 255 个成员,涵盖了主要的 CPU、内存、存储和网络设备制造商。国际巨头纷纷加入 CXL 联盟,积极布局 CXL 技术,推出支持 CXL 技术的产品,助力 CXL 的发展。

6、CXL联盟定义了三种类型的设备

CXL 标准定义了三个协议:1)CXL.io 协议本质上是 PCIe 5.0 的改进,用于初始化、链接、设备发现和列举以及寄存器访问。2)CXL.cache 协议定义了主机和设备间的交互,允许连接的 CXL 设备以极低的延迟高效地缓存主机内存。3)CXL.mem 协议提供了主机处理器,使用加载和存储命令访问设备连接的内存。

CXL 联盟定义了三种类型的设备,分别支持不同的子协议。CXL.io 协议用于初始化和链接,所以必需获得所有 CXL 设备的支持,如果该协议发生故障,链接就无法运行。第一种设备用于智能 NIC 等设备。第二种设备用于带有内存的加速器,如 CPU、GPU、FPGA 等。第三种设备用于内存拓展和池化。

7、CXL市场空间广阔,DRAM占据主要份额

CXL 高速互联目前处于市场应用的早期阶段,未来有望迎来快速发展,采用 CXL协议服务器的占比持续提升。根据 Yole 的预测,到 2025 年,采用 CXL 协议的数据中心服务器占比达到 60%左右,到 2027 年,这一数据将接近 100%。Yole 预测到 2028年,CXL 市场总收入将超过 150 亿美元。

DRAM 占据 CXL 市场的主要份额,国际巨头纷纷进行布局。Yole 预计到 2028 年,DRAM 市场规模达到 125 亿美元,占到 CXL 市场规模的 79%。三星和海力士相继推出了采用 CXL 内存控制器的 CXL 内存模组。2023 年 5 月,三星电子推出其首款支持CXL2.0 的 128GB DRAM,加速下一代存储器解决方案的商用化进程。

相关阅读:

转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
中国快递业不需要“小院高墙”使用VPN“翻墙”违法,为什么大部分人都没事?老钱ZT:咋办?WCGClinical:2024临床试验趋势洞见报告澳洲企业破产率飙至近10年新高,3月份倒了1040家!专家:破产潮年内或持续Vercel:用生成式UI重塑前端开发《阴阳鱼》连载第39章:时间如刀,空间如砧板,而你我都不过是鱼肉PRL:力学褶皱诱导挠曲电效应调控纳米薄膜极化拓扑结构饮食高球味,人间烟火情(9)日本“高球小件”多NEJM:老药新用又一经典案例;学习CXCR4抑制剂的研究思路,你也可以挖出自己的惊喜!Java 8内存管理原理解析及内存故障排查实践英国老人狠批当代“脆皮”年轻人,国家有你,倒大霉了!瀚为科技刘奕杨:破壁|Z Circle张杰住在“女生宿舍”,冉莹颖住在“男生宿舍”?!网友:破防了,别惹哭我......当代“卖身契”震撼!Cell:切掉85%的肝脏,猪死了;加上这个药,猪活了,且猪肝重新长大!1期临床试验结果显示了良好的安全性逼家里蚊子出来“自杀”!新型第三代“蚊虫灭绝机”!亲测好用!平讯 | 中国竟有如此用心复刻宋代“古”牙膏的团队,卫卿原浆牙膏,植物原粉原膏高达80%±的植物源,温婉不刺嘴,爱牙齿更保护环境存储激荡60载:DRAM、Flash、存算一体、HBM和CXL新一代“汽车人”不智能,汽车怎么智能?| 极客时间【MR、TYP -> CX 10% Bonus, MR -> EY 20% Bonus (targeted)】转点奖励活动汇总当时都吓坏了!囚犯“凿墙”集体越狱,钻出洞惊见一群警察在开会(图)无问芯穹夏立雪:破解算力焦虑,我做了大模型算力领域的「淘宝」丨36氪专访邓文迪、章泽天、谷爱凌红毯pk:三代“社交女王”,如何混迹上流社会?Cell:早上治疗,抗癌效果更好,王宸/曾群等揭示昼夜节律影响免疫治疗效果硅谷三月新闻:硅谷李师傅对话富国银行CEO|Amino独角兽CXO晚餐会 |李师傅在奥斯卡之后的亚裔电影大奖42岁韩国初代“整容模版”被嘲老,曾为家庭放弃事业:下辈子不想再结婚三星疯狂扩产HBM,下注CXL打破内存墙韩国政府与医生彻底决裂?或强迫罢工医生服兵役,2万医生将上街:破罐破摔病人死就死!美股基本面 - 2024_03_02 * 晨报 * 迈向新纪元!英伟达CEO黄仁勋:5年内AI或可通过人类测试。特斯拉这款车百手机随笔:《云是猫做的》港交所和纳斯达克对中企IPO吸引力旗鼓相当;拜登敦促扩大中国Biotech制裁名单;德昇济医药完成Medicxi领投的A+轮融资Cell | 新研究发现肺部和大脑之间存在直接的沟通途径​晚点财经丨美团多了位 CEO;ASML:中国客户买买买;日元便宜了,赴日游客数创纪录
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。