一, HBase 的历史由来
HBase 是一个开源的非关系型分布式数据库(NoSQL), 基于谷歌的 BigTable 建模, 是一个高可靠性, 高性能, 高伸缩的分布式存储系统, 使用 HBase 技术可在廉价 PC Server 上搭建起大规模结构化存储集群.
HBase 最初是以 Hadoop 子项目的形式进行开发建设, 直到 2010 年 5 月才正式成为 Apache 的顶级项目独立发展. 伴随着互联网时代数据的澎湃增长, HBase 作为基础存储系统得到了快速发展与应用, 大批知名商业公司 (Facebook,Yahoo, 阿里等) 自主地加入到了 HBase 生态建设队伍, 成为 Apache 最活跃的社区之一.
在大批知名公司的推动下, 以及结合 HBase 自身的能力, HBase 应用场景非常广泛, 例如 Cube 分析, 推荐画像, 对象存储, 消息 / 订单存储, 时序数据, Feeds 流, 时空数据, NewSQL 等多个领域.
二, HBase 普及和应用难点
整个 Hadoop 技术体系也不知不觉的走过了 10 年的青葱岁月, 但相比关系型数据库超过 40 年的发展, 还显得稚嫩. 相比成熟的关系型数据库, HBase 的普及和应用, 有以下难点:
生产部署至少 4 个节点, 起步成本高.
原始只有 API 接口, 偏底层, 需要较强编程功底.
技术资料少.
社区活动少.
三, 技术平民化, 阿里云 HBase 团队在行动
为了普及和推广 HBase 生态, 降低 HBase 使用难度, 让更多的公司享受到 HBase 技术红利.
阿里云 HBase 团队在产品, 生态, 客户服务方面积极投入, 希望通过微薄的力量造福整个中国 HBase 技术生态, 让 HBase 技术平民化, 让那些只有大公司才玩的起的技术真正走进 SME, 校园和广大开发者.
1, 推出云 HBase 单节点版本, 极低成本, 降低使用门槛
阿里云云 HBase 服务正式推出单节点版本, 欢迎访问 https://promotion.aliyun.com/ntms/act/hbasesingle.html 了解更多.
HBase 单节点版本是在集群版本的基础上推出的基础版本, 相比集群版本的 4 个节点起步, 单节点版本 HBase 服务全部部署在一个节点上, 因此单节点版本价格非常低. 同时单节点是具备小规模生产能力的, 具备纵向伸缩能力, 提供 11 个 9 的数据集可靠性和 2 个 9 的服务可用性, 所以单节点版本非常适合开发, 测试以及非核心业务小规模生产环境.
HBase 单节点有以下特点:
体验一致 : 和云数据库 HBase 集群版本各种操作, 监控体验一致
低成本 : 年度爆款, 99 元 / 3 月, 399 元 / 年
高性能: 深度内核优化, 性能高于社区版本 50%-200%
弹性灵活: 多种规格选择, 未来支持实例升级变配, 选择灵活
2, 提供 SQL 能力, 造福广大 DBA 和开发者
过于底层的 API, 使得 HBase 使用起来难度巨大. 相比原生 API,SQL 能力是广大 DBA 和开发者提升开发和使用效率的利器, 云 HBase 服务默认包含 Phoneix 服务.
Phoenix 是一个开源的 HBASE SQL 层. 它不仅可以使用标准的 JDBC API 替代 HBASE client API 创建表, 插入和查询 HBASE, 也支持二级索引, 事务以及多种 SQL 层优化.
另外, 我们在云栖社区中推出一系列专业文章, 帮助 HBase 用户很好的理解和使用 HBase 和 Phoenix:Phoenix 系列文章. 此系列文章将会从 Phoenix 的语法和功能特性, 相关工具, 实践经验以及应用案例多方面从浅入深的阐述. 希望对 Phoenix 入门, 在做架构设计和技术选型的同学能有一些帮助.
另外, 功能更强大和完善的 HBase SQL 能力也持续研发中, HBase 使用难度会进一步降低, 适应场景更加广泛.
3, 回馈社区, 积极推动社区发展
阿里由于业务上的需要, 内部深度使用 HBase, 内部集群规模整体超过 12000 台, 单集群超过 1000 台. 在长期的实践和使用中, 也培养了大量的专家, 积累了雄厚的技术实力, 目前拥有 3 HBase PMC,6 Committer, 数十位内核贡献者. 我们在收获社区的技术支持的同时, 也积极回馈社区, 给社区贡献超过 200+ Patch, 同时阿里云平台提供了多种方便易上手的数据产品工具. 除了产品上, 我们在社区的推广和建设中也积极投入人力和物力.
- 主办 Apache HBasecon Asia 2018 大会
HBaseCon 大会是 Apache HBase官方举办的技术会议, 发起于 2012 年, 是 HBase 技术人员的盛会. 阿里云主办 2018 届 HBase 亚洲大会, 大会预计在下半年举行, 我们会在第一时间公布在技术社区中. 欢迎广大 HBase 技术爱好者关注.
- 打造 HBase 中文社区, 完善 HBase 中文资料
HBase 发源于美国, 发源于社区, 所以存在资料不完善, 核心资料都是英文的问题, 进一步加大了开发人员学习和掌握 HBase 的难度.
云 HBase 团队联合国内众多大公司的研发 leader,HBase 社区 PMC, 推出 HBase 中文社区, 打造一个技术人员的技术交流家园, 组织广大的社区爱好者积极分享 HBase 技术文章, 共同促进 HBase 技术氛围的形成. 也欢迎更多的同学加入 HBase 技术社区, 一起营造 HBase 技术家园.
中文社区网站:
http://www.hbase.group/
4, 一颗公益之心, 义务抢救客户数据
4.13 日, 某公司使用自建一个 HBase 集群挂了! 整个集群有 30+T 业务数据, 是公司的数据中心, 集群直接启动不了. 他们也是经历了熬战一天一夜的情况下, 依旧没有解决恢复, 还曾有过重装集群重导数据念头. 最后, 通过钉钉 HBase 技术交流群找到阿里云的技术团队同学. 技术同学立刻自发组成抢救小分队, 尽力最大的努力, 使用最低风险的方式, 抢救最完整的集群.
事后, 技术负责人王华激动的表示: 非常感谢阿里大牛的帮助, 协助我们解决了关键问题, 避免了 30TB 业务数据遗失的重大损失.
感谢这群单纯的技术人, 让 HBase 技术社区有温度!
四, 写到最后
一项技术的发展和成熟, 都要经历无数的技术人员, 无数个日夜, 不眠不休持续奋战. 也需要集全社会的力量, 更多的公司一起参与进来共同打造更好的产品和更好的生态.
阿里云 HBase 团队希望通过这些星星之火, 点燃 HBase 以及整个 Hadoop 技术生态的草原.
普及 HBase, 阿里云 HBase 团队在行动!
来源: https://yq.aliyun.com/articles/595981