自 2006 年至今十余年来, 金融行业内容管理系统通常采用 Documentum+DB+NAS 的整体解决方案, 如下图 1 所示, Documentum 结合 DB 的索引能力和 NAS 的存储能力, 向上为影像平台等业务提供文档数据的存储和检索读取服务.
近年来随着非结构化数据的爆发性增长, 由于 Documentum 系统架构问题, 此套解决方案出现了明显性能瓶颈, 杉岩海量对象存储系统 (SandStone MOS) 采用全分布式架构, 针对海量文件场景提供可线性扩展的持续快速访问性能, 同时提供全方位的海量数据保护支持和数据生命周期管理功能, 能够完美替代 Documentum. 作为金融行业内容管理系统的未来核心模块, 不仅要提供现在和未来的服务保障, 更要能够完美接纳客户现有数据, 所以需要提供平滑友好的 Documentum 迁移方案.
Documentum 应用架构
基于 Documentum 的应用平台如图 2 所示, 存储仓库 (Repository) 作为数据及元数据的最终存放位置, 包含内容存储系统 (Content Store) 及元数据存储系统 (Metadata Store); 内容服务器(Content Server) 位于存储仓库之上, 通过封装好的接口给上层应用提供处理文档数据的调用接口; 上层应用 (web Application,Desktop Application 等) 通过调用内容服务器提供的 API 接口, 给最终用户提供友好的文档内容管理功能, 轻松应对文档的存档, 搜索, 分类, 处理, 安全保密和归档保存等一系列工作.
Documentum 模块介绍
存储仓库(Repository)
一个存储仓库是一个基本的内容和元数据存储单元, 包含内容存储系统 (Content Store) 和元数据存储系统 (Metadata Store), 如图 3 是一个最小的存储仓库结构, 默认情况下 Documentum 通过主机本地文件系统存储内容, 通过关系数据库(RDBMS,Relational Database Management System) 管理元数据及其相互关系, 另外一个仓库可以同时包含多个内容存储系统, 并且这些内容存储系统可以是不同类型, 比如关系数据库, 本地文件系统, NAS 等.
内容服务器(Content Server)
内容服务器负责内容和元数据的生命周期管理, 用户无需关心文件和元数据具体存在哪里, 通过一个接口即可访问内容(content). 一个 Content Server 只能对应一个 Repository, 但是一个 Repository 可以配置多个 Content Server, 这样有如下好处:
通过多个 Content Server 分担压力, 提高整体性能
通过远程 Content Server 为远端用户提供优质服务
通过多 Content Server 提供高可用和灾备恢复支持
杉岩 NAS 异构特性介绍
传统 NAS 设备在已经存放了数千万级别文件数量的情况下, 性能急剧下降, 读写延迟可达到 5-10 秒, 在杉岩对象存储实施的过程中, 由于 NAS 接口性能的瓶颈, 导致现有数据的迁移周期长达数月之久, 为此我们开发了 NAS 异构特性.
如图 5 所示, SandStone MOS 纳管 NAS 设备的元数据, 无需立即触发数据内容搬迁, 应用统一使用 S3 接口即可访问 NAS 和 MOS 的数据, 通过生命周期转移策略, 可以后期平滑迁移 NAS 文件到 SandStone MOS, 数据内容搬迁过程中无需停机, 业务切割时间窗极短.
来源: http://www.bubuko.com/infodetail-3339810.html