距离 2017 年 8 月发布第一版双模 SSD 设计规范以来, 仅仅过了半年时间, 最近, 阿里巴巴正式双模 SSD(Dual-Mode SSD)存储架构, 同时发布全球首个双模 SSD 产品 AliFlash V3, 采用自研的存储控制器芯片 AliFSC, 同时支持 OpenChannel 和 NVMe 模式, 此为 AliFlash 的双模
之前笔者只听说过 Dual-port SSD, 这是 NVMe 全闪存阵列的重要基础, Dual-Mode 的话笔者只听说过 SATA3 和 USB 双模的叫法, 阿里巴巴的 Dual-Mode SSD 是 OpenChannel 和 NVMe
一直以来, OpenChannel 和 NVMe 是 PCIe 闪存加速卡和 SSD 盘中最主流的两大阵营
PCIe 的 NVMe SSD 相比常见于的 SATA AHCI 的 SSD 在性能功耗延迟方面有明显优势, 这是 NVMe 得以快速发展的基础 NVMe 是一种开放式非易失性存储标准, 允许 SSD 用自身闪存的读 / 写速度运行, 用多通道的 PCIe 口访问闪存, 比原来的 SATA 和 SAS 快的不止一点半点
OpenChannel 与 NVMe 在实现上最大的区别是前者是 Host-based 的设备, 后者是 Device-based,Host-based 的 OpenChannel 把关键的 FTL 处理工作都交给了主机 CPU 来执行, 后者 NVMe 的 FTL 工作由 SSD 自身的控制器来完成
Host-based 的好处是能充分利用 CPU, 在普遍认为 CPU 资源过剩的前提下, 这一观点站得住脚, 而且, 如果利用 CPU 的话, 能更好地与应用绑定, 方便做一些针对性的调优, 所以, 更有软件定义的意思而且, 因为用的是主机的 CPU, 自身的计算能力就降低了, 所以, 有成本价格优势
Device-Based 的好处是不依赖主机, 适用性更好, 能减少了用户对主机 CPU 计算和内存资源的消耗, 更大的优势在于, 当系统突然断电的时候, Device-based 的设备能用电容中存的电量把数据整理起来不至于直接丢了, 数据更安全一些
要 Device-Based 还是要 Host-based 之争似乎一直没有定论, 不过也有专家表示两者走向融合也是趋势, 阿里的双模也算是一次尝试
回过头来看 AliFlash V3
AliFlash V3 适配主流 3D TLC/QLC NAND flash, 实现了从 NAND 颗粒控制器芯片固件驱动用户态 I/O 栈的全链路打通
AliFlash V3 不仅提供通用的块设备支持, 还针对业务需求定制优化和开发增强功能, 更与业务团队联合开发了软硬件一体化方案, 发挥出双模 SSD 架构的巨大潜力与效益
应用方面, AliFlash V3 与存储引擎 Fusion Engine 结合使用, Fusion Engine 是阿里自研的全球首个商业化用户态存储引擎 Fusion Engine, 实现软硬件一体优化, 帮助客户取得极致 I/O 性能和优化 TCO 阿里巴巴官方宣称: 预计降低成本 50%, 性能提升 5 倍, 即性价比提升 10 倍
许多人其实并不知道阿里有自研硬件, 不知道阿里有定制化的 AliCPU, 不知道阿里有自研服务器 AliServer, 更不知道阿里还有 AliFlash, 当然更不知道 AliFlash 其实都进化到第三代了
早在 2016 年, 阿里巴巴的 SSD AliFlash V1 就上线在用了, 从一开始就是自研的, SSD 控制器是自研的, 自主可控, 有全部的源代码
AliFlash V2 开始只支持 NVMe 1.2 标准, 确实 NVMe 标准在英特尔的宣传攻势下呼声更高一些, OpenChannel 的先驱代表 Fusion-io 倒下 (被收购) 之后更是如此, 不过近来看 OpenChannel 仍有市场需求, 双模 SSD 的推出也在验证这一看法
到 AliFlash V3 的时候, 还采用了第一个自研存储控制器芯片 AliFSC, 自主可控更进一步
AliFlash V3 是阿里巴巴双模 SSD 架构的首个商用产品商用意味着以后不在只是自己用了, 可以卖给别人用了, 意味着在技术白盒化供应链管理质量管理等方面都已经越来越成熟了, AliFlash V3 产品已成功生产, 并上线应用了
BAT 这样的互联网公司是 PCIe 加速卡厂商的大用户, 然而, 阿里自己推出这样的闪存加速卡确实有点出乎意外, 但考虑到其应用规模, 长远来看有其战略意义, 既然服务器都能自己做, 何况一个 SSD 呢
来源: https://yq.aliyun.com/articles/560517