Redian新闻
>
从AI服务器谈HBM、HBM2、HBM3、HBM3e技术

从AI服务器谈HBM、HBM2、HBM3、HBM3e技术

公众号新闻

HBM即高带宽存储,由多层DRAM Die垂直堆叠,每层Die通过TSV穿透硅通孔技术实现与逻辑Die连接,使得8层、12层Die封装于小体积空间中,从而实现小尺寸于高带宽、高传输速度的兼容,成为高性能AI服务器GPU显存的主流解决方案。

目前迭代至HBM3的扩展版本HBM3E,提供高达8Gbps的传输速度和16GB内存,由SK海力士率先发布,将于2024年量。

HBM主要应用场景为AI服务器,最新一代HBM3e搭载于英伟达2023年发布的H200。根据Trendforce数据,2022年AI服务器出货量86万台,预计2026年AI服务器出货量将超过200万台,年复合增速29%。

AI服务器出货量增长催化HBM需求爆发,且伴随服务器平均HBM容量增加,经测算,预期25年市场规模约150亿美元,增速超过50%。

HBM供给厂商主要聚集在SK海力士、三星、美光三大存储原厂,根据Trendforce数据,2023年SK海力士市占率预计为53%,三星市占率38%、美光市占率9%。HBM在工艺上的变化主要在CoWoS和TSV。

相关阅读:

HBM1最早于2014年由AMD与SK海力士共同推出,作为GDDR竞品,为4层die堆叠,提供128GB/s带宽,4GB内存,显著优于同期GDDR5。

HBM2于2016年发布,2018年正式推出,为4层DRAMdie,现在多为8层die,提供256GB/s带宽,2.4Gbps传输速度,和8GB内存;HBM2E于2018年发布,于2020年正式提出,在传输速度和内存等方面均有较大提升,提供3.6Gbps传输速度,和16GB内存。HBM3于2020年发布,2022年正式推出,堆叠层数及管理通道数均有增加,提供6.4Gbps传输速度,传输速度最高可达819GB/s,和16GB内存HBM3E由SK海力士发布HBM3的增强版,提供高达8Gbps的传输速度,24GB容量,计划于2024年大规模量产。

HBM因其高带宽、低功耗、小体积等特性,广泛应用于AI服务器场景中。HBM的应用主要集中在高性能服务器,最早落地于2016年的NVP100GPU(HBM2)中,后于2017年应用在V100(HBM2)、于2020年应用在A100(HBM2)、于2022年应用在H100(HBM2e/HBM3),最新一代HBM3e搭载于英伟达2023年发布的H200,为服务器提供更快速度及更高容量。

HBM供给厂商主要聚集在SK海力士、三星、美光三大厂,SK海力士领跑。三大存储原厂主要承担DRAMDie的生产及堆叠,展开技术升级竞赛,其中SK海力士与AMD合作发布全球首款HBM,23年率先供应新一代HBM3E,先发奠定市场地位,主要供应英伟达,三星供应其他云端厂商,根据TrendForce数据,2022年SK海力士市占率50%、三星市占率40%、美光市占率10%左右,2023年SK海力士市占率预计为53%,三星市占率38%、美光市占率9%。

HBM在封装工艺上的变化主要在CoWoS和TSV。

1)CoWoS:是将DRAMDie一同放在硅中介层上,通过过ChiponWafer(CoW)的封装制程连接至底层基板上,即将芯片通过ChiponWafer(CoW)的封装制程连接至硅晶圆,再把CoW芯片与基板连接,整合成CoWoS。当前,HBM与GPU集成的主流解决方案为台积电的CoWoS,通过缩短互连长度实现更高速的数据传输,已广泛应用于A100、GH200等算力芯片中。

2)TSV:TSV硅通孔是实现容量和带宽扩展的核心,通过在整个硅晶圆厚度上打孔,在芯片正面和背面之间形成数千个垂直互连。在HBM中多层DRAMdie堆叠,通过硅通孔和焊接凸点连接,且只有最底部的die能向外连接到存储控制器,其余管芯则通过内部TSV实现互连。

GPU技术篇

更新提醒:“存储系统基础知识全解(终极版)”和“服务器基础知识全解(终极版)”已经更新发布,还没有获取的读者,请在点击“原文链接”在微店留言获取PDF阅读版本)。



转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。

全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价439元)。


温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
Discord 使用单台服务器服务于 100 万在线 MidJourney 用户电影《拿破仑》评论:完美造假流水账 尿点走肾不走心Timescale 推出无服务器数据库的替代方案,Dynamic PostgreSQL存储激荡60载:DRAM、Flash、存算一体、HBM和CXL收获和康复之路录取喜报|UCD+9、UCI+3、维思+1、伦敦大学+2、伦敦政治经济+1、曼彻斯特+1、伦敦国王学院+1一键开服!阿里云上 3 分钟搞定幻兽帕鲁联机服务器搭建服务器之五大关键组件拆解Vision Pro预售超20万台、服务器被挤爆,苹果能否成功掀起空间计算产业革命?英伟达新核弹B200发布,一台服务器顶一个超算,万亿参数大模型30倍推理加速|亮马桥小纪严选感谢剑桥爱我两次,2023、2024两次获得剑桥offer,这跟中大奖有什么区别?0门槛开服!人工一对一服务,2小时无忧搭建《幻兽帕鲁》个人服务器!腾讯致歉,多款热门游戏服务器集体崩溃“雷军,雷神”热搜爆了!开售27分钟,大定破5万,服务器被挤爆!股价狂飙,一度涨超10%1、2、3、4、5、6、7……见义勇为!Linux服务器CPU持续飙高原因排查离不开这几步!纪源资本符绩勋:四个关键词总结2023、展望2024代购价超7万元、服务器被挤爆,苹果Vision Pro真被低估了?运维总监让我 1 个人管理 4万 台服务器,他是不是在“扯淡”?风起AI服务器,谁才是真正的国产之光?小雪2-4月截止!5大类15个夏校可选!ROSS 罗斯数学营、SSP、HCSSiM、SLAI 仍接受申请!2024年服务器行业深度报告纪源资本符绩勋:四个关键词总结2023、展望2024|投资笔记第158期阴差阳错出国门(2)录取喜报|佐治亚理工+1、UIUC+5、UW–Madison+2、罗格斯+3、多伦多+3幻兽帕鲁服务器三步迁移,支持图形化管理配置5分钟,挤爆服务器!起价2.5万,苹果新品被抢空!消息称英伟达 Blackwell“B100”GPU 将配 192GB HBM3e 显存,B200 配 288GB 显存矩阵模拟!Transformer大模型3D可视化,GPT-3、Nano-GPT每一层清晰可见5分钟挤爆服务器,18分钟后被抢空!苹果这一新品开订,国内代购价最高达7万元......服务器基础知识全解(终极版)品牌周报|大人糖探索女性公共友好空间的新可能、likeuu 3周年向青春期发问、HBN续写「求真」的故事《奥本海默》有望入围奥斯卡《幻兽帕鲁》意外封神后,阿里云们的服务器被玩家买爆了
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。