Zhiwei Zhang included in Notes

2022-09-22 2022-09-22 172 words One minute

Contents

主要由Flash Memory 和FTL组成

Non-Volatile Memory 提供低延迟持久性的内存/存储，也可以用来做内存

根据延迟数量级，一般用PCM做内存，Flash Memory做外存

0x00 Flash Memory

闪存原理

类型

NOR闪存

存储密度低
可字节改写

NAND闪存（主流）

存储密度高
不可覆盖写

用于外存需要较高的存储量级，一般用NAND

闪存单元

读：电压代表不同数值

写：电子注入

相比晶体管添加了浮栅门，保存电子

原理其实比较简单，非电子系就不做太详细的研究了

闪存页(4KB,8KB,16KB，读写单元)，阵列中的每一行

闪存块(擦除单元)，由多个页组成的单元

选中行和列，然后将数据加载到Sense Amplifiers

存储单元有两个阈值的电压，可以根据两个电压的中点作为读电压，2.5V读电压时左边通电，数据为1，右边则不通电，数据为0

Pass Through

选取一个较大的电压，使得所有的单元都接通，数据为1，不影响其他行的状态

如图所示的存储结构，在第二行施加2.5V电压，其他行施加5V，最终读取数据为0011

上述为SLC，Single Level Cell，单存储单元

多比特闪存

多比特闪存单元MLC，包含2Bits 4个Level的数据

TLC 3 Bits 8个Level

QLC 4 Bits 16个Level

多比特使用格雷码来编码

使用格雷码使得相邻单元只有一位差异，方便纠错

多比特提高了存储密度，但是提高了错误率，因为施加的电压差距很小。可靠性会降低。

对于多比特的写，MLC分为高比特和低比特，对于低比特的状态加偏移电压确定高比特，在低比特时需要加的电压较大，操作难度低，运行速度快，在高比特时需要加的电压小，波形的间距小，操作难度高，运行的速度较慢。

对于多比特的读，先看lower bit，加一次电压，即可筛选出低位的0，1，再加两次电压确定upper bit。因为upper bit为0的在中间部分，为1的在两侧，因此需要在两个分界线分别加一次电压来确定upper bit为多少。

闪存

Block的大小的一种配置：

一行有两个Page，Upper Page和Lower Page，每个单元中，低位构成Lower Page，高位构成Upper Page，有128个单元，128K/8=16KB

有64列bitlines，一个block的大小即为16KB*64*2=2MB，一般按照此比例配置Block

写入时按照固定顺序，写入高低页面相互独立，不能同时写，在写入加压时容易使相邻单元发生数据偏移，要降低错误率

写入是需要先擦除再写入，擦除整个块

特性

读写粒度

闪存页读写粒度：

4KB，8KB，16KB必须全部读取或者写入
us延迟

闪存块擦除力度

2MB擦除
ms延迟，可以通过FTL来优化

不可覆盖写

写前需要擦除，读写粒度与擦除粒度不同

存在64bytes的OOB（out of bound area），保存ECC，用于纠错，容忍写入时部分比特出错

有限次擦除

随着擦除次数的增加，存储单元不能可靠的保持状态（存储数据）。

氧化层老化变薄，束缚电子能力变弱

耐久性变薄地次数
保持力不通电可以放置的时间

SLC：10w次

MLC：1w次

TLC：1k次

根据特性设计FTL固件来

0x01 FTL

固态硬盘整体构成

SSD中的通道可以并行，通道中也可以并行读取，每个Plane中有寄存器，暂时存储准备好的数据。不同单元并行，因此内部带宽大

垃圾回收

page对于OS而言，是写入时的block

Page三种状态

空闲 free page
有效页 live/valid page
无效页 dead/invalid page

需要擦除无效页，先移走有效页，然后再对一整行进行擦除，转为空闲

时间开销：

复制有效数据到$(R_{Latency}+W_{Latency})*N$，N是移动page的数量
擦除产生的开销 ms级延迟

GC策略

要解决的问题：

何时启动GC
选中那些/多少Block进行GC
有效的页如何被转写
新数据写到哪里

GC的时间开销：

块擦除的时间 ms
有效页的复制时间

贪心策略：

找到脏页最多的block来进行擦除

优化：

Age
Hot/Cold 数据隔离，分组问题

磨损均衡

优化寿命，有静态和动态策略

静态：周期性的调整冷热数据存储的位置

冷热数据的分区：将冷数据放在一起，热数据放在一起

FTL简介

维护映射，虚拟地址到物理地址
使用SRAM存储映射
向上层隐藏擦除操作：
- 避免原地更新->异地更新
- 更新一个新页面
- 高性能的垃圾回收和擦除

OOB有物理地址到虚拟地址的映射，用于掉电恢复，这里引用一段wisc的OSTEP中的一段解释（44 Flash- based SSD）。

OOB保存的在每个页中映射信息，当掉电或者重启时用它在内存中重建映射

为了防止在重建时扫码整个SSD，可以使用日志或者检查点的方式来加速这个过程

大致看了一下OSTEP，记得是jyy老师推荐的教材，希望以后有时间读一下

Page-Level FTL

原理类似OS中的页表，由Logical Page Number查询页表得到Physical Page Number

缺点是页表占用很大的空间

Block-Level FTL

保持Block 到Block的映射

先查找到对应的Block，在根据offset得到page，块内的页码偏移offset是固定的

优点是占用空间很小，缺点是GC负载增加

原因：offset在不同Block中保持不变，在异地更新时，要选择其他block中相同的offset进行写入，如果选中的block已经存在数据，需要把数据迁移。【TODO 这里讲得不是非常的清楚】

Hybrid FTL

对写入分为新/旧数据，新写入的数据用Page-Level Mapping效率高，写入Log Blocks作为缓冲，之后再更新到Data Blocks

旧数据因为写入后更新相对不频繁，使用Block-Level Mapping，写入Data Blocks

【存储技术基础】固态硬盘