面对“性能墙”、“存储墙”双墙阻碍,四大新型存储升级算力
存储技术伴随应用场景变化,新兴领域催生更高需求。存储行业兴起于 1960s,现被广泛应用于各种领域的电子设备。现在,随着 AIoT、5G、智能汽车等新兴应用场景出现,存储行业的市场需求进一步增加,对数据存储在容量、速度、功耗、成本、可靠性等层面提出更高要求。
本文来自“双墙阻碍算力升级,四大新型存储应用探讨”,关于和存储详细技术及资料获取,请参考“下载提醒:服务器基础知识全解(终极版)”,“2023年服务器计算机CPU行业报告”、“2023年机架式服务器行业洞察”、“2023~2025服务器CPU路线图”、“2023服务器产业链及市场竞争格局”、“存储系统关键技术全解(终极版)”、“更新下载:存储系统基础知识全解(终极版)”、“存储芯片技术基础知识介绍(2023)”等等。
“性能墙”与“存储墙”成为限制传统存储器应用于新兴领域的两座难关。
“性能墙”源于处理器与存储器发展失衡。随着半导体产业的发展,处理器和存储器分别走向了不同工艺路线。由于二者工艺、封装、需求的不同, 从 1980 年到 2000 年,处理器性能的年增长速度约为 60%,而存储器性能每年提高的幅度低于 10%,导致“存-算“的失配速度以每年 50%的速率增加。因此,处理器和存储器之间出现数据交换通路狭窄现象,及由此引发的高能耗问题,二者成为存储与运算间的“性能墙”。
“存储墙”来源于计算架构中多级存储的特性差异。现代计算系统通常采取高速缓存(SRAM)、主存(DRAM)、外部存储(NAND Flash)的三级存储结构。由于各级存储的应用特性不同,三级架构间均存在较大的响应时间及传输带宽差距,形成了制约系统性能的“存储墙”。其中,靠近运算控制单元的存储器需要响应速度更快,但受到功耗、散热等因素制约,其存储容量也越小,例如 SRAM 响应时间在纳秒级,NAND Flash 则仅为 100 微秒级,但后者的存储容量较大,造价低廉,且具备非易失的低功耗特性,适用于长期存储海量信息。随着新兴应用下处理器的速度和核数持续增加,“存储墙”成为制约处理器性能发挥的主要因素之一。
受益于万物智联时代的新兴应用发展,由于传统存储器存在“性能墙”和“存储墙”问题,新型存储器的研发和产业化逐渐进入历史舞台。基于材料介质改造或技术升级,出现 PCRAM、MRAM、ReRAM 和 FeRAM 四大类型的新型存储,下文中逐一探讨。
1、模糊外存和主存界限,PCRAM 产业化面临障碍
以相变材料为存储介质的新型存储——PCRAM。PCRAM(相变存储器)的原理是通过改变温度,让相变材料在结晶态(导电)与非结晶态(非导电)状态间相互转换,并利用两个状态的导电性差异来区分“ 0”态和“ 1”态,从而实现数据存储。PCRAM 具有外存 NAND Flash 的非易失性,以及主存 DRAM 高读写速度和长寿命的特点,同时兼具低延时、密度高、功耗低、可兼容 CMOS 工艺等优点,具有将外存和主存合二为一的可能性,未来有希望应用于高性能数据中心、服务器、物联网等场景。
此外,目前 PCRAM 还未发现有明确的物理极限,研究表明即使相变材料降至 2nm 厚度,存储器件依旧可以发生相变。因此,PCRAM 可能解决存储器工艺的物理极限问题,成为未来通用的新一代半导体存储器件之一。
PCRAM 现阶段具有较多应用瓶颈,致使商业化停滞。首先,由于 PCRAM 存储过程依赖温度调节,具有对温度的高敏感度,导致其无法应用于宽温场景。其次,PCRAM 存储器采取多层结构,以具备兼容 CMOS 工艺的特点,致使存储密度过低,无法满足替代 NAND Flash 的容量条件。此外,成本和良率也成为其大规模产业化的瓶颈之一。
2、MRAM 产品进入量产,eMRAM 替代 SRAM 空间大
磁存储器(MRAM)的基本单位为磁隧道结(MTJ)。MTJ 由一对被薄绝缘材料层隔开的铁磁金属板组成,其中一块金属板(固定层)的磁场方向永不变化,另一块板(自由层)的磁场方向可以因外部磁场的改变而改变。MTJ 通过电阻大小表示数据,由于隧道磁阻效应,如果两个板具有相同的磁化方向(低电阻状态),则将其视为“1”,而如果方向反平行(高电阻状态),则表示“0”。但传统 MRAM单纯用奥斯特场对普通的 MTJ 进行状态切换,存在严重的不稳定性和严苛的应用条件。
STT-MRAM(自旋扭矩转递)为当前主流商业化方案。自 2000 年 Spintec实验室获得首个 STT 技术专利开始,STT-MRAM 凭借更快的读写速度与更小的尺度逐渐成为主流商业化方案。2005 年 11 月,瑞萨科技与 Grandis 合作开发 65nm 工艺的 STT-MRAM。2005 年 12 月,索尼推出首款实验室 STT-MRAM 产品。2008 年 11 月,三星与海力士宣布合作开发 STT-MRAM。2012 年 11 月,Everspin 首次推出 64Mb 容量的独立式 STT-MRAM 产品。2019 年 3 月,三星28nm 工艺的嵌入式 STT-MRAM 产品开始量产。
MRAM 增长点为替代闪存与嵌入式缓存。由于价格较高,容量短时间无法赶超 NAND FLASH 等原因,独立式 MRAM 目前主要应用于工业、航空、航天、军工等对可靠性和读写速度要求较高、容量无需太大的领域。随着容量进一步提升,独立式 MRAM 产品已逐渐进入数据中心等更大规模的市场,未来随着价格下降和容量扩大有望替代 NAND FLASH 等成为主力外部存储产品。目前嵌入式 MRAM已成功进入 MCU 嵌入式系统,并逐步替代慢速 SRAM 成为工作缓存新方案,应用于相机 CMOS 等。未来嵌入式 MRAM 提速降价后有望替代 SRAM 或 eDRAM等高速缓存,进入手机 SoC 和 CPU 等产品。
3、ReRAM 替代 eFlash 成长空间广阔
可变电阻式存储器(ReRAM)以基本单位电阻变化存储数据。氧化层释放氧离子后产生的氧空位(Vacancy)与金属层中氧离子的运动共同决定了基本单位的电阻,高低电阻分别对应“0”和“1”。
嵌入式 ReRAM 替代 eFlash 进入模拟芯片为主要增长点,独立式替代 NOR FLASH 成长空间可期。独立式 ReRAM 在读写速度等方面不及 MRAM 和 FLASH等技术,但价格较低,易于制造。目前独立式 ReRAM 在工业级小容量存储得到广泛应用,并在 IoT 领域逐步替代 NOR FLASH。随着容量进一步提升和读写速度的突破,独立式 ReRAM 有望替代闪存进入企业级存储市场。嵌入式 ReRAM 按位寻址、对辐射和电磁场的高耐受性和较低的功耗等优点有效解决了目前嵌入式闪存(eFlash)在模拟芯片、医疗和工业以及 IoT 等领域面临的问题,目前已替代eFLash 可用于音频芯片、LED 驱动芯片等模拟芯片市场,在技术得到进一步验证后有望进入 MCU 芯片等。随着技术进一步发展,ReRAM 有望进入 CPU 作为最后一级高速缓存。
4、FeRAM 研发正当时,多种优势突破传统存储限制
FeRAM 是一种断电时可以保存数据的非易失存储器,存储机制和铁磁存储的滞后行为类似。当一个电场被施加到铁晶体管时,中心原子顺着电场停在低能量状态 I 位置,反之,当电场反转被施加到同一铁晶体管时,中心原子顺着电场的方向在晶体里移动并停在另一低能量状态 II,大量中心原子在晶体单胞中移动耦合形成铁电畴,铁电畴在电场作用下形成极化电荷。铁电畴在电场下反转所形成的极化电荷较高,铁电畴在电场下无反转所形成的极化电荷较低,这两种反差状态可以被记作“1”或“0”,FeRAM 可以用二进制的方式来存储数据。
FeRAM 具有非易失性、读写速度快、寿命长、功耗低、可靠性高等特点。FeRAM 读写速度快;寿命长,可重复读写,重复次数可达到万亿次;功耗低,待机电流低,无需后备电池或采用充电泵电路;更加可靠,兼容 CMOS 工艺,工作温度范围宽,可靠性高。FeRAM 既有 ROM 的非易失性数据存储特性,又有 RAM的无限次读写、高速读写以及低功耗等特性,多种优势加持,正在成为存储器未来发展方向之一。
FeRAM 最早在麻省理工大学达德利·艾伦·巴克在 1952 年提出的硕士论文中被提及,论文中提到,FeRAM 有比闪存更低的耗电量、更高的写入速度、更长的读写寿命等优势。由于存算一体的特性和诸多优势,FeRAM 成为新型存储的主流产品之一。1993 年 Ramtron 公司推出 4Kb FeRAM 产品,为全球首款可量产FeRAM 产品,此后,FeRAM 的更多研发和应用开启新篇章。
FeRAM 技术瓶颈尚在,仍需继续研究突破。当前,FeRAM 的工作模式主要包括 DRO(破坏性读出)和 NDRO(非破坏性读出)两种。在 DRO 模式中,FeRAM 读出后需重新写入数据,信息读取过程中存在着大量的擦除/重写操作,由于不断地极化反转,FeRAM 容易发生疲劳失效的问题。NDRO 模式无需使栅极的极化状态反转,读出方式是非破坏性的,是一种比较理想的存储方式,但目前这种 FeRAM 尚处于实验室研究阶段,还未达到实用层面。
5、四种新型存储优势各异,市场化程度也有不同
四种新型存储都能在一定程度上有效解决传统存储的“性能墙”和“存储墙”的问题,打破冯·诺依曼体系架构,实现存算一体,消数据访存带来的延迟和功耗,实现更高的算力和能效比,但是四种新型存储的具体技术特点和商业化程度有所不同。
四种存储商业化阶段不同,MRAM 产业化程度最高。目前 MRAM 存储已进入产业化阶段,在独立式存储和嵌入式存储上均有量产,三星在 2019 年为索尼代工的卫星定位模块中使用 MRAM 技术,台积电在 2020 年集成电路设计领域ISSCC 国际会议上发布了 32 Mb 嵌入式 STT-MRAM;其次,FeRAM 有小规模应用,汇峰目前已经有 130nm 制程 FeRAM 产品可实现小批量量产;PCRAM 主要在混合固态盘和持久内存方面有少量应用,2015 年英特尔与美光联合研发的128 Gb 3D Xpoint 芯片是目前唯一大规模商用的 PCM 产品;RRAM 目前商业化还未真正落地。
在寿命、读写速度、功耗、抗辐射方面,四种存储各有优势。持久性方面,MRAM、FeRAM 较高;存储密度方面,FeRAM 较低,MRAM、PCRAM、RRAM较高;读写速度方面,FeRAM 最快;读写功耗方面,PCRAM 最高,MRAM、FeRAM、RRAM 均较低;抗辐射方面,除 MRAM 外,其他均较高。
更多存储技术,请参考文章“存储系统关键技术全解(终极版)”,“多路径和iSCSI SAN存储技术介绍”,“云存储:系统架构及技术基础”,“存储基础和FC SAN存储介绍”,“存储芯片技术基础知识介绍(2023)”等等。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取“架构师技术全店资料打包汇总(全)”电子书资料详情。
微信扫码关注该文公众号作者