第一批基于闪存的固态 (SSD) 硬盘在 12 年前就已经出现, 但直到现在, 该技术才有望取代数据中心的机械 (HDD) 硬盘, 至少在主存储领域是如此. 为什么需要这么长时间? 毕竟, 采用随机 I/O 的闪存驱动器比 HDD 硬盘的速度要快 1000 倍.
其部分原因是忽略了系统, 而只是将其重点放在存储元件和 CPU 上. 这导致业界专注于其每 TB 的成本, 而真正的焦点应该是采用或没有采用闪存的解决方案的总成本的比较. 简而言之, 大多数系统都是 I/O 绑定的, 使用闪存不可避免地意味着在相同的工作负载下需要更少的系统. 这通常抵消了成本差异.
存储行业的转折点来自全闪存阵列: 简单的插入式设备, 可立即显著提升存储区域网络 (SAN) 的性能. 这已经演变成一种双层存储模式, 其中 SSD 硬盘作为主要存储层, 而速度较慢但成本更低的 HDD 硬盘作为次要存储层.
将新的闪存模型应用于服务器可以提供更高的服务器性能, 就像 SSD 硬盘的价格低于企业硬盘价格一样. 凭借良好的经济性和更好的性能, SSD 硬盘现在成为主存储层的首选.
如今人们看到 NVMe(高速非易失性内存)技术的兴起, 其旨在取代串行连接 SCSI(SAS)和串行高级技术附件 (SATA) 作为主要存储接口. NVMe 是一个非常快速, 低开销的协议, 可以处理数百万 IOPS, 远远超过其前身. 在去年, NVMe 的定价接近 SAS 驱动器价格, 使其解决方案更具吸引力. 而在今年, 人们将看到大多数支持 NVMe 端口的服务器主板, 可能是支持 SATA 驱动器的 SATA-Express.
NVMe 是服务器的内部组件, 但是新的 NVMe over Fabrics(NVMe-oF)方法将 NVMe 协议从服务器扩展到 NVMe 驱动器阵列, 以及全闪存和其他存储设备, 并补充了新的超融合基础设施 (HCI) 模型用于集群设计.
不过, 这些发展并没有结束. 存储产品供应商承诺 2018 年将生产 32TB 和 64TB 容量的 SSD 硬盘. 这比目前容量最大的 16TB 的 HDD 硬盘要大得多, 并且 HDD 硬盘在热辅助磁记录技术解决之前将一直处于困境.
然而, 残酷的现实是 SSD 硬盘实现了 HDD 硬盘驱动器无法实现的外形尺寸. 大型 HDD 硬盘尺寸为 3.5 英寸. 而如今已经有 2.5 英寸尺寸的 32TB 固态硬盘以及 M2.0 和 "ruler"(细长的 M2.0)等新外形尺寸的 SSD 硬盘, 这将为小型设备提供大量存储容量. 英特尔公司和三星公司在 1U 大小的设备中可以实现 PB 级存储容量.
二级存储市场发展缓慢且价格低廉, 这阻碍了 SSD 硬盘在二级存储市场的广泛应用. 3D NAND 和新型 Quad-Level Cell(QLC)闪存器件的兴起将在很大程度上缩小价格差距, 而每个驱动器的巨大容量将通过减少设备数量来弥补剩余的价格差距.
SSD 硬盘在二级市场中有一个秘密武器: 由于整个存储结构中有额外的带宽, 使其重复数据删除和压缩变得可行, 可以有效地将容量扩展 5 倍到 10 倍. 这降低了以每千兆字节的价格计算 QLC-Flash 解决方案的成本, 其成本低于 HDD 硬盘.
最终, 也许在短短三到四年内, 闪存和 SSD 硬盘将成为数据中心的主要存储产品, 除了保守和顽固的用户之外, 所有的 HDD 硬盘都会被淘汰. 以下将深入探讨 SSD 硬盘将如何主导数据中心存储的情况.
(1)系统性能
在推出 x86 架构后的 37 年中, CPU 发展速度一直遵循摩尔定律, 每隔几年翻一番. 而在此期间内, HDD 硬盘的随机存取的速度只提高了 3 倍. 存储阵列带来了跨数据条带的一些并行访问, 但无法提高 CPU 的性能.
随之而来的是 SSD 硬盘, 其中单个驱动器的速度甚至比大型 HDD 存储阵列还要快. 这导致人们重新思考存储系统, 其得出的结论是减轻 I/O 需求, 这意味着人们需要更少的服务器来处理相同的工作负载. 例如, NVMe SSD 速度如此之快, 以至于它们可以支持运行速度比传统 HDD 硬盘系统快 100 倍的内存数据库.
人们已经看到了这种新观点的结果. 传统的存储阵列销售正在下降, 而厂商正在用 SSD 硬盘替换服务器中使用的企业级 SAS 驱动器. 公平地说, 快速 HDD 硬盘是一个即将消亡的品种.
(2)闪存芯片的定价
3D NAND 的应用并不顺利, 这导致了其价格下滑. 由于其生产问题已经解决, 3D NAND 是一项坚实的技术. 其价格再次开始下滑, 但与 HDD 硬盘的价格差距仍然大致为三比一.
这一差距为 HDD 硬盘制造商提供了一些解决方案, 但存储分层也会影响整个集群的总体拥有成本, 因此即使在大容量存储中, 也会考虑采用 SSD 硬盘.
2018 年, 将会有更多新的闪存代工厂正在投产. 结合向 3D NAND, 芯片堆叠和 QLC 技术的发展, 他们将生产新一代大容量的主要读取存储器, 它将取代二级存储空间, 成为比任何 HDD 硬盘解决方案成本更低和更紧凑的选择. 同样, 对于任何给定容量, 将需要更少的存储设备.
(3)存储分层
随着存储模式从大量的并行 HDD 硬盘向快速 SSD 硬盘演进, 快速主存储和缓存二级存储之间的分层存储概念已经启动. HDD 硬盘可以满足慢速大容量存储的需求, 但 SSD 硬盘容量的快速增长以及 3D NAND 和 QLC 单元等低成本闪存的出现, 标志着向基于闪存的二级存储的转变.
此外, 添加的压缩和重复数据删除功能, 都有助于提高 SSD 硬盘的带宽, 并且在大多数使用情况下, 二级存储的有效容量可扩展 5 倍至 10 倍. 重复数据删除和压缩用于快速主存储, 以节省二级网络存储的传输成本和带宽, 从而大幅节省二级存储的采购成本.
(4)新的存储软件
SSD 硬盘具有性能优势, 现在人们看到创业公司对 "挖掘" 次级数据层有创造性的想法. 这是软件定义存储方法的一个例子, 它将吸引人们将数据服务链接在一起以实现结果. 在数据处理通过链处理时, SSD 硬盘的低访问延迟变得重要.
对象存储正在向 SDS 模型发展, 人们已经可以在目前使用 SSD 的对象存储中看到其出色的性能. 专家预测文件和块 I/O 将迅速成为访问底层对象存储的协议, 实现统一和更简单的存储模型.
(5)以太网 NVMe
随着 SSD 硬盘性能的快速提升, 集群结构的带宽也随之增加. 在 2010 年, 1 千兆位以太网被认为很热门. 而如今, 400GbE 骨干网正在推向市场. 更重要的是, 远程直接数据存取 (RDMA) 支持现在很常见. RDMA 释放大量 CPU 时间移动数据.
由于更高效的协议 NVMe 取代了它, SCSI 协议正在结束其 30 年来的存储优势. 使用该协议的 SSD 硬盘可实现数百万 IOPS, 从而实现大数据分析以及其他应用程序.
人们现在看到量身定制 NVMe 在以太网上运行. 这将使 SSD 硬盘能够直接连接到集群结构, 为超融合基础设施增加了新的速度和连接性.
(6)新的形式因素
与 HDD 硬盘不同, SSD 硬盘不受 HDD 硬盘尺寸的限制. 目前已有 32TB 2.5 英寸固态硬盘, 2018 年供应商将推出相同外形尺寸的 64TBSSD 硬盘. 直到 2019-2020 年 HAMR 技术产品推出为止, HDD 硬盘驱动器一直处于领先地位. 即使如此, 大容量硬盘的尺寸一直是 3.5 英寸, 没有任何突破.
这意味着使用 SSD 硬盘的服务器和设备可以在相同尺寸下获得更多容量. 例如, 2U 服务器如今可以安装 24 个 SSD 硬盘(768TB), 相比之下, 同样的服务器只能安装 12 个 HDD 硬盘, 容量大约 180TB.
此外, M2.0 固态硬盘的尺寸更加紧凑, 因此产生了具有 32TB 原始容量的 "ruler" 硬盘的新设备. 如果人们将其与传统阵列或当今基于服务器的节点进行比较, 就可以看到节省了大量设备成本和空间. 如果添加重复数据删除和压缩功能, 1U 存储设备的容量甚至可能达到 5PB.
来源: http://stor.51cto.com/art/201805/573315.htm