Redian新闻
>
深度SSD入门:专业术语知道多少?

深度SSD入门:专业术语知道多少?

公众号新闻
SSD主要由控制单元和存储单元组成,控制单元包括SSD控制器、主机接口、DRAM等,存储单元主要是NAND FLASH颗粒。NAND FLASH内部存储读写的基本单元为BlockPage
更多存储技术,请参考文章“存储系统关键技术全解(终极版)”,“多路径和iSCSI SAN存储技术介绍”,“云存储:系统架构及技术基础”,“存储基础和FC SAN存储介绍”,“存储芯片技术基础知识介绍(2023)”等等。

● Block:能够执行擦除操作的最小单元,通常由多个Page组成;

● Page:能够执行编程和读操作的最小单元,通常大小为16KB
NAND FLASH读写数据的操作主要涉及擦除(Erase)、编程(Program)和读Read),其中编程和读的基本操作单位是Page,擦除的基本操作单位是Block。在写入一个Page之前,必须要擦除这个Page所在的整个Block。因此在写入某个Page时,需要把Block中其他有效的数据拷贝到新的存储空间,从而把原先的整个Block擦除,这一过程称为垃圾回收(Garbage Collection,简称GC)。每一次对Block的编程写入和擦除称为一次P/EProgram/Erase)。不同于机械硬盘HDDSSD盘中对每个Block的擦写次数是有限制的。如果某些Block的擦写次数太多,将会导致该Block不可用。
SSD领域涉及到较多的专业术语,为了更深入地了解SSD技术,本文对常用SSD术语进行简要的说明和介绍。
盘内磨损均衡
磨损均衡是指SSD控制器通过对NAND FlashBlockP/E次数进行监控,通过一定的软件算法使所有BlockP/E次数比较平均,防止单个Block因过度擦写而导致失效,延长NAND FLASH整体的使用寿命。
动态磨损均衡是指在主机数据写入的时候,优先挑选磨损较小的Block使用,这样保证P/E消耗平均分布;静态磨损均衡是指盘片定期在整个盘片的范围内寻找P/E消耗较少的Block并回收其上的有效数据,从而使得保存冷数据的Block也参与到磨损均衡的循环中。HSSD通过这2方案的结合来保证全盘磨损均衡。
坏块管理
NAND FLASH芯片在制造和使用过程中会逐渐出现一些不符合要求的存储单元,此类Block将被标志为坏块。如果出现坏块,则通过NAND FLASHXOR冗余校验数据来计算出坏块上的数据,并将数据恢复到新的可用Block上。在一个SSD生命周期内,盘片会出现坏块,SSD在盘片内部预留了空间用作坏块替换,确保在生命周期内可能出现的坏块可以及时被替换,保障SSD上的数据安全可靠。
数据冗余保护
由于SSD在使用过程中可能会出现数据位翻转和跳变,数据在SSDDRAM中使用了ECCCRC校验来防止数据跳变和篡改;数据在NAND FLASH中使用了LDPCCRC校验来保护Page上的数据;而在不同的NAND FLASH之间则采用了XOR冗余进行保护以防止颗粒失效导致的数据丢失。
LDPC即低密度奇偶校验码(Low Density Parity Check Code),是通过校验矩阵定义的一类线性码,主要用于数据校验和纠错,广泛应用于无线通信、卫星数字传输等领域。在数据写入NAND FLASHPage时,计算出数据的LDPC校验信息一起写入到Page中;在从Page中读取数据的时候通过LDPC进行校验和纠错。
后台巡检
NAND FLASH上的数据会由于存放时间过长,读干扰、写干扰、随机失效等原因导致数据发生错误。HSSD会周期性的读取NAND FLASH上的数据,识别数据跳变情况,对于出现高比特位跳变的数据及时读取并写入到新的Page。通过这一后台巡检过程可以提前识别出现的风险并进行处理,能有效防止这些错误导致的数据丢失,提高数据的安全性和可靠性。
Namespace
命名空间,是 NVMe 协议中一个基本的逻辑空间的概念。简单地说,命名空间将 NVMe SSD 的用户空间进行逻辑划分,每个命名空间拥有自身的 NAND 颗粒,可以独立地进行格式化和加密等操作。
OP
Over-provisioning,一般称为预留空间,它是指 SSD 保留一部分闪存空间留作他用,这部分空间用户不可操作,容量大小一般是由主控决定的,一般不建议用户自行修改。OP 空间在垃圾回收(Garbage Collection, GC)、耗损平衡(Wear Leveling, WL)、减少写入放大(Write Amplification, WA)等多个方面都有作用,具体如何应用要取决于 SSD 主控算法。OP 的使用情况对于磁盘的健康状态是有影响的。
DWPD
Diskful Writes Per Day,每日整盘写入次数,是指在预期寿命内可每日完整写入 SSD 固态硬盘所有容量的次数。这个参数一般会作为参考 NMVe SSD 寿命和性能的重要评测数据。由于 SSD 的实现是基于电气原理的,每个 NAND 颗粒的擦写(P/E)次数是有限制的,一般厂家都会标定一个寿命期限。OP 所实现的 WL 对于维护磁盘的使用寿命具有很重要的意义。


MTBF
Mean Time Between Failures,平均无故障工作时间,或相邻两次故障之间的平均工作时间,是衡量一个产品的可靠性指标,单位为“小时”。MTBF主要通过实证法采用加速应力方式来证明产品长期可靠度,主要通过高温加速测试计算评估,从测试深度、广度、持久度三个方向进行测验。
PI
Protection Information,保护信息。完整的端到端数据保护支持由Host端生成PI,提供从Host直至SSD内部的完整端到端数据路径保护。在数据生成时,通过对数据添加PI,并将其作为元数据始终伴随用户数据一同传输和校验,借此降低静默错误的发生;同时,借助ECC(如BCH、LDPC)、Die间RAID5等手段,对检测到的错误数据加以修正,提升整个端到端数据传输过程中的可靠性。PI也可以通过SSD Controller生成,提供SSD盘内的数据保护,通常,后者称为“数据路径保护”技术。
PI与用户数据通常是连续存放。这要求SSD在提供标准的用户数据存储空间(如512字节或4096字节)之外,额外提供PI作为元数据的存储区域。
VSS
Viable Sector Size,可变Sector Size,也叫活性扇区大小。它允许SSD在保存用户数据的同时,保存该数据的元数据,也就是对PI的存储。它是全闪存阵列实现NVMe端到端数据保护,降低静默错误发生的必要前提。在保证一致性能前提下,进一步保证存储系统和分布式文件系统对数据可靠性的高要求。
DIF/DIX
PI 的具体实现包括 DIF 和 DIX 两种方式,这两种数据保护机制的主要区别是 PI 信息的位置不同。具体选择哪种格式,要根据应用场景的需求。
  • Data Integrity Field (DIF),即元数据与用户数据(LBA Data)连续存放。

  • Data Integrity Extension (DIX),元数据与用户数据单独存放。
SR-IOV
Single-Root I/O Virtualization,单根 I/O虚拟化。是一种基于硬件的虚拟化解决方案,通过利用PF和VF的属性,将一个设备虚拟出多个PCIe设备,利于虚拟机操作,从而大大减轻宿主机的CPU负荷,提高性能和可伸缩性,帮助系统解决虚拟机SSD盘的QoS问题,可支持更多数量的虚拟机业务。VM可直接与VF通信,不需要Hypervisor接入IO处理,节约 vCPU资源,实现性能隔离。
SR-IOV可实现多个虚拟机共享物理资源,且bypass Hypervisor(或者VMM)软件层,使得虚拟机可使用到NVMe SSD的高性能。
PRP
Physical Region Page,物理(内存)区域页,主机侧用于通知SSD数据所在的内存位置的一种方式。NVMe把Host的内存分为页的集合,页的大小在CC寄存器中配置,可以是4K、8K…128MB,PRP Entry是一个64位的内存物理地址指针,描述的是一段连续的物理内存的起始地址,PRP list中每个PRP Entry都描述一个物理页。每个NVME 命令有两个域,PRP1和PRP2,Host通过这两个域告诉SSD数据在内存中的位置或数据需要写入的地址。
SGL
Scatter Gather List,散列聚集列表,是另一种索引内存的数据结构。用以描述一段数据空间,该空间可以是数据源所在空间,也可以是数据目标空间,SGL由若干个SGL segment组成,每个segment又由若干个SGL descriptor组成。与PRP描述物理页不同,SGL可以描述任意大小的内存空间,更为灵活。
Multi-stream write
多流写,该技术可以使SSD根据主机端提供的Stream ID,将具有相同或相似生命周期的数据写入到相同的擦除单元中去,大大提高GC时的效率,减少写放大,使得SSD的性能和寿命都有较大的提升。
ZNS
Zoned Name Spaces,分区命名空间。ZNS将一个Namespace的逻辑地址空间切分成单个zone(一种固定大小的子区间),每个zone都有一段LBA(Logical Block Address, 逻辑地址空间)区间,这段区间只能顺序写,而且如果要覆盖写,则必须进行一次擦除操作。这样,namespace就可以把NAND内部结构的边界透露给外界。NVMe SSD也就能够将地址映射表等内部管理工作交由host去处理,从而减少写放大、选择合适的GC时机。ZNS驱动器减少了用于过度配置的额外闪存,因为它们不希望频繁写入,因此成本更低。
通过了解这些术语,我们可以更好地理解SSD技术的原理和性能特点,并在选择、使用和优化SSD时做出更明智的决策。

更多关于NVMe技术细节,请参考文章“NVMe SSD性能影响因素一探究竟(上)”,“NVMe SSD性能影响因素一探究竟(下)”,“一文掌握RDMA、NVMe和NVMe-oF”,“收藏:NVMe协议基础原理介绍”,“漫谈NVMe、NoF和RDMA技术”,“NVMe over Fabric网络技术介绍”,“基于RDMA/NVMe低时延存储系统设计”,“NVMe over Fabric存储网络技术分析”,“收藏:NVMe协议基础原理知识”,“NVMe技术基础知识”,“深入剖析NVMe Over Fabrics”,“NVMe over RoCEv2网络技术要求和测试规范”等等。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。

推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价439元)。

温馨提示:

扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情


微信扫码关注该文公众号作者

戳这里提交新闻线索和高质量文章给我们。
相关阅读
一周热门:4000英镑中国学生奖学金等你拿!多所QS前100大学降低录取要求!热门专业截止申请!以色列和哈马斯的地道战为什么可怕?水结冰的最高温度是多少,沸腾的最低温度是多少?世界顶级名画背后的故事,你知道多少?史上最大规模 USDT 冻结,东南亚一个国际人口贩卖集团2.25亿USDT被冻结[注意]​你知道多久要看一次牙医?加拿大人为了省钱这么干…The Missing Driver: How a Tragedy Sparks Kindness Across China《数据要素 术语表》发布 | 附下载成年人红着脸都会看完的床上冷知识!你知道多少?关于健康写实与琼瑶言情传统,你知道多少?Burwood入室抢劫最新细节曝光!“被劫匪压制在床!”6旬华人大叔头破血流!劫案频发,6小时6户民宅中招,有人惨死街头...别随便摆摊了!农历新年前清查非法摊贩 八大道多家货品被抄!甘蔗和活鸡活鸭也摆满过道...5年前对英伟达和特斯拉的判断对了多少?错了多少?重磅!加拿大牙科保健计划最快下周申请!怎么报销覆盖多少?这是你需要知道的“年度SUV”实至名归 揽境定义全新家庭出行时代生病了一位看到上海万圣节的中年阿姨说:好想哭,又看到人了。你对加拿大的假期了解多少?加拿大法定假日你都知道么?[电脑] 都是PCIe4.0和8通道主控,企业级SSD和消费级SSD实力差距如何?【体育内参】广东省体育局等三部门:广东大中小学将设体育教练员 需要具备以下专业条件【外汇商品】美国不同部门间信贷需求分化——评2023年第三季度SLOOS报告注意了!这些术语不可用于化妆品宣传2-4月截止!5大类15个夏校可选!ROSS 罗斯数学营、SSP、HCSSiM、SLAI 仍接受申请!谁是你的同党!ESG行业洞察 | ESG基金定位不明朗,第三季度SFDR重新分类数量仅为峰值20%还只知道多伦多、温哥华吗?加拿大人纷纷表示想去这里!解读那些令人困惑 Git 术语 | Linux 中国[电脑] 迟到的巨头--SK Hynix Platinum P41 2TB SSD专业向评测专门盗刷粮食卡!背后团伙作案!8大道多位华人已受害!我国人口是多少?40后、50后、60后、70后、80后、90后、00后的人口分别占多少?精选SDE岗位 | Adobe、Nasdaq、Old Mission公司岗位发布!美国“入门级”的房子均价多少?新移民如何才能买得起房子习大大兼任央行太上行长,六权分立+伟光正母婴行业观察创始人杨德勇:专业创造价值,精细化运营时代到来[电脑] YMTC 232L+NVMe 2.0--Lexar ARES 4TB M.2 SSD专业向评测
logo
联系我们隐私协议©2024 redian.news
Redian新闻
Redian.news刊载任何文章,不代表同意其说法或描述,仅为提供更多信息,也不构成任何建议。文章信息的合法性及真实性由其作者负责,与Redian.news及其运营公司无关。欢迎投稿,如发现稿件侵权,或作者不愿在本网发表文章,请版权拥有者通知本网处理。