精简版
0
0
0
云栖社区 > HBase+Spark 社区> 博客>正文
杨晗 2019-12-20 13:24:29 浏览 155
分布式
hbase
性能
钉钉
aliyun
索引
查询优化
展开阅读全文
HBase 原生提供了主键索引, 用户可以根据 rowkey 进行高效的单行读, 前缀匹配, 范围查询操作. 但若需要使用属性列进行查询时, 则只能使用 filter 在查询范围内进行逐行过滤. 在扫描范围较大时, 会浪费大量的 IO, 请求 RT 也无法保证. 为此, HBase 增强版推出了原生二级索引来解决非 rowkey 查询的性能问题.
云 HBase 增强版是基于阿里内部的 HBase 分支 (亦称 Lindorm) 构建的, 二级索引是其核心能力之一, 历经多年双 11 大考, 在性能, 吞吐, 稳定性等方面都具备核心竞争力.
下面, 我们从一组示例出发来了解索引的使用及其能力.
功能简介
从表设计和查询设计的角度看, HBase 增强版二级索引的使用与 RDBMS 的二级索引基本一致. 下面我们看一个简单的示例: 大学生信息表 (Students), 该表的主键(即 rowkey) 是学号, 非主键是学生姓名和所属
来源: https://yq.aliyun.com/articles/740009