一, 八年双十一, 造就国内最大最专业 HBase 技术团队
阿里巴巴集团早在 2010 开始研究并把 HBase 投入生产环境使用, 从最初的淘宝历史交易记录, 到蚂蚁安全风控数据存储. 持续 8 年的投入, 历经 8 年双十一锻炼. 4 个 PMC,6 个 committer, 造就了国内最大最专业的 HBase 技术团队, 其中 HBase 内核中超过 200 + 重要的 feature 是阿里贡献. 集团内部超过万台的规模, 单集群超过千台, 全球领先.
二, HBase 技术团队重磅发布 X-Pack, 重新赋能轻量级大数据平台
阿里云自从 17 年 8 月提供 HBase 云服务以来, 到 18 年 12 月累计服务了上千大 B 客户, 已经有上千个在线的集群. 是阿里云增长最为快速的数据库服务, 也是大 B 客户比例最高的云服务之一. 并于 6 月 6 日全球第一个推出 HBase 2.0, 是 HBase 领域当之无愧的排头兵.
为了满足客户对数据库更丰富业务处理需求, 更易用, 强大功能的需求, 我们重磅发布 X-Pack : 支持 SQL, 时序, 时空, 图, 全文检索能力, 及复杂分析. 阿里云 HBase 从 KV 为主大数据数据库成功进化成 "轻量级全托管大数据平台" 数据库.
全部能力计划 12 月底全部上线.
三, 深度解读 "轻量级全托管大数据平台", 云 HBase 能力再上新台阶
通常一个大企业里面, 数据和业务存在天然的多样性. 真正称得上平台级的数据库, 要至少要满足客户不同三个及以上层次的诉求, 才能称的上平台级.
阿里云 HBase 从成本最优化, 运维便利性, 业务敏捷度三个方面将 HBase 的能力全面提升一个高度, 成就轻量级全托管大数据平台, 云 HBase 能力再上新台阶.
2.1 轻量级, 满足 CXO 成本最优化的诉求
1) 起步成本低, 整体成本低, 扩展性强.
云 HBase 针对企业不同的使用环境, 不同的 SLA 诉求, 云 HBase 一共提供 3 个版本, 分别满足开发环境, 在线业务, 以及金融级业务的诉求. 单节点版本, 低廉的价格用于开发测试场景, 集群版本, 99.9% 可用, 满足企业在线业务诉求, 支持最高 5000 万的 QPS 和 10P 的数据. 还有支持金融级高可用的双活版本. 所有版本都支持 11 个 9 的数据可靠性, 无需担心数据丢失.
2) 支持冷存储, 助你不改代码, 1/3 成本轻松搞定冷数据处理
大数据场景下, 存储成本占比往往是大头, 把存储成本降下来, 整体成本才能下降.
一般随着业务的发展, HBase 中存储的数据量会逐渐变大. 在这些数据中, 业务最关心的, 最常访问的, 往往是某些特定范围的数据, 比如说最近 7 天的数据, 业务对这类数据访问频次高, 延迟要求高, 即所谓的热数据. 而其他的数据, 一般访问量极少, 性能要求不高, 但这类数据往往数据量大, 即冷数据. 如果能把冷热数据分离开, 把热数据存储在性能更好的介质中, 而把庞大的冷数据放到成本更低的介质中, 从而实现把更多优质资源用来提高热数据的读写性能, 同时节省存储成本的目的.
阿里云 HBase 针对冷数据存储的场景, 提供一种新的冷存储介质, 其存储成本仅为高效云盘的 1/3, 写入性能与云盘相当, 并能保证数据随时可读. 冷存储的使用非常简单, 用户可以在购买云 HBase 实例时选择冷存储作为一个附加的存储空间, 并通过建表语句指定将冷数据存放在冷存储介质上面, 从而降低存储成本, 基本不用改代码就获得了低成本存储能力, 助力企业降低整体成本.
2.2 全托管, 全面解放运维, 为业务稳定保驾护航
大数据时代, 数据是企业最宝贵的资产, 业务是企业赖以生存的基础. 因此高可用和高可靠是最基本诉求. 云 HBase 提供的全托管服务相比其他的半托管服务以及自建存在天然的优势.
依托持续 8 年在内核和管控平台的研究, 以及大量配套的监控工具, 跨可用区, 跨域容灾多活方案, 云 HBase 提供目前业界最高的 4 个 9 的可用性 (双集群),11 个 9 的可靠性的高 SLA 的支持, 满足众多企业客户对平台高可用, 稳定性的诉求.
云 HBase 服务定位为全托管服务, 后台自动代维和保持服务稳定性, 极大的降低了客户使用门槛, 让无论是 SME, 还是巨头都能享受到 HBase 技术红利. 选择云 HBase 就是选择了高可用, 高可靠服务!
3.3 全面能力提升, 源头解决业务敏捷度, 真正释放数据和业务的价值
1)100% 兼容原生接口和能力, 开发简单, 容易上手.
云 HBase 百分百兼容开源接口, 并提供一系列配套开发, 数据搬迁, 监控工具, 全面帮助用户提高开发和管理效率.
2) 独家跨 Region/AZ 双活
阿里云是云 HBase 首家推出跨 Region/AZ 双活, 在一个集群出现故障的时候, 迅速地将业务切换至另外一个集群从而避免故障. HBase 主备之间数据的同步基于异步链路实现, 遵循最终一致性协议, 典型的主备同步延迟在 200ms 左右. 满足金融, 社交, 电商, 人工智能等关键领域对高可用的诉求.
3) 备份恢复量级提升百倍以上, 数据库领域最大
我们经常会听到 "某某某 DBA 误操作把整张表删了","某某磁盘故障, 造成数据库的某个库的数据全部损坏了". 这种由于外在和内在的原因造成的数据不可靠, 最终会给用户带来毁灭性的灾难.
所以一个企业级数据库, 全量备份, 全量恢复, 增量备份, 增量恢复, 是基础能力. 传统数据库备份恢复的能力都是 TB 级别, 这在交易等场景下面是足够的, 但是面向大数据场景就捉襟见肘了. 云 HBase 通过垂直整合高压缩, 内核级优化, 分布式处理等能力, 将备份恢复的量级成功推高百倍以上, 做到百 TB 级别甚至更高, 让客户大数据量下面也无后顾之忧.
4) 支持融合多模型和融合多负载, 提供开箱即用的能力
云 HBase 在 KV 的基础上, 同时支持时序, 时空, 图, 文档等多种数据模型, 内置丰富处理能力, 让业务开发效率提升百倍.
在线能力的基础上, 融合流处理, 批处理, OLAP,OLTP, 高速对象存储, 全文检索等能力, 提供客户融合业务开箱即用的能力.
四, 展望未来, 持续优化服务, 不负重托, 成就客户
历经近 8 年的技术沉淀, 阿里巴巴大数据 NoSQL 数据库处理技术的精华沉淀在 HBase 上, 后者成功支撑了成功支撑了阿里经济体中最大的 NoSQL 业务体量, 是阿里大数据处理技术的核心组成部分, 当前将这项技术应用到广大企业中, 助力企业发现数据价值.
短短 1 年间, 就覆盖了社交, 金融, 政企, 车联网, 交通, 物流, 零售, 电商等数十个个行业, 帮单用户顶住千万级 QPS 的业务压力, 以及百 PB 级数据高效存储和处理.
展望未来, 云 HBase 团队定不负客户重托, 持续围绕客户业务, 成本, 运维各个方面优化服务, 成就客户!
X-Pack 将会在 12 月 13 日第 8 届中国云计算标准和应用大会隆重发布, 敬请期待!
来源: https://yq.aliyun.com/articles/674911