Redis 现如今使用的场景越来越多? 如何批量删除 key 呢?
有人说用 KEYS 命令, 刚开始学 Redis 的时候就是用这个命令列出库中键.
KEYS 命令要谨慎使用.
为何? 客观别急, 我们先一步步来看.
KEYS 命令
Warning: consider KEYS as a command that should only be used in production environments with extreme care. It may ruin performance when it is executed against large databases. This command is intended for debugging and special operations, such as changing your keyspace layout. Don't use KEYS in your regular application code. If you're looking for a way to find keys in a subset of your keyspace, consider using sets.
上面是官方文档声明, KEYS 命令不能用在生产的环境中, 这个时候如果数量过大效率是十分低的. 同时也不要用 KEYS 正则匹配, 官方建议直接用集合类型.
有人说 KEYS 相当于关系性数据的库的 select *, 在生产环境几乎是要禁用的.
KEYS 命令的性能随着数据库数据的增多而越来越慢
KEYS 命令会引起阻塞, 连续的 KEYS 命令足以让 Redis 阻塞
试想如果 Redis 阻塞超过 10 秒, 如果有集群的场景, 可能导致集群判断 Redis 已经故障, 从而进行故障切换;
以上的情况严重会导致应用程序出现雪崩的情况.
然而, 网上很多都是这么写的 Redis-cli --raw keys "key 前缀 *" | xargs Redis-cli del, 千万别照炒, 拿到生产环境上做实验.
顺便普及下 xargs 命令, 这是 Linux 下的一个命令 .
xargs 命令是给其他命令传递参数的一个过滤器, 也是组合多个命令的一个工具. 它擅长将标准输入数据转换成命令行参数, xargs 能够处理管道或者 stdin 并将其转换成特定命令的命令参数. xargs 也可以将单行或多行文本输入转换为其他格式, 例如多行变单行, 单行变多行. xargs 的默认命令是 echo, 空格是默认定界符. 这意味着通过管道传递给 xargs 的输入将会包含换行和空白, 不过通过 xargs 的处理, 换行和空白将被空格取代. xargs 是构建单行命令的重要组件之一.
SCAN 命令
Redis 从 2.8 版本开始支持 scan 命令, SCAN 命令的基本用法如下:
复杂度虽然也是 O(n), 通过游标分步进行不会阻塞线程;
有限制参数 COUNT ;
同 keys 命令 一样提供模式匹配功能;
服务器不需要为游标保存状态, 游标的唯一状态就是 scan 返回给客户端的游标整数;
scan 用法
SCAN cursor [MATCH pattern] [COUNT count]
scan 命令提供三个参数, 第一个是 cursor, 第二个是要匹配的正则, 第三个是单次遍历的槽位
第一个遍历是 cursor 值为 0, 然后将返回结果的第一个整数作为下一个遍历的游标, 如果最后返回的到 cursor 的值为 0 就代表结束.
- 127.0.0.1:6379> scan 0 MATCH tony*
- 1) "42"
- 2) 1) "tony25"
- 2) "tony2519"
- 3) "tony2529"
- 4) "tony2510"
- 5) "tony2523"
- 6) "tony255"
- 7) "tony2514"
- 8) "tony256"
- 9) "tony2511"
- 10) "tony15"
- 127.0.0.1:6379> scan 42 MATCH tony* COUNT 1000
- 1) "0"
- 2) 1) "tony3513"
- 2) "tony359"
- 3) "tony4521"
- 4) "tony356"
- 5) "tony30"
- 6) "tony320"
- 7) "tony3"
- 8) "tony312"
返回分为两个部分如上面的代码中, 1) 代表下一次迭代的游标, 2) 代表本次迭代的结果集
, 注意如果返回游标为 0 就代表全部匹配完成.
批量删除 scan 命令
因为 KEYS 命令的时间复杂度为 O(n), 而 SCAN 命令会将遍历操作分解成 m 次, 然后每次去执行, 从而时间复杂度为 O(1). 也解决使用 keys 命令遍历大量数据而导致 Redis 服务器阻塞的情况. 所以建议使用下边的指令进行批量的删除操作:
Redis-cli --scan --pattern "key 前缀 *" | xargs -L 1000 Redis-cli del
总结
因为 Redis 是但线程的 KEYS 在某种情况下会阻塞. 有个真实真案件小哥哥生产用 KEYS, 最终导致服务宕机. 后果很严重, 产生的经济损失就不说了.
切记严重会导致程序的雪崩, 删除的时候用 SCAN 命令, 看完这篇文章应该都记住了.
Redis 开发的建议
1, 数据分离
不要什么都往 Redis 中放, 尽量放些 QPS 比较高的数据, 内存的开销很昂贵的, 可以考虑硬盘存放.
2, 分业务
不同的实例单独放这样存取的时候方便些, 故障的时候也不会影响其他的实例.
3, 压缩
Redis 中有很大的单个 key 的值建议压缩成二进制存放.
4, 失效时间
Redis 中设置 key 的失效时间, 如果不设置会一直占用着内存, 而且 key 的失效时间应该根据业务场景来设置.
5, 容量
占用内存不要太大 10-20G, 其次键的数量控制在 1 千万以内.
6, 监控
运维合理的监控好数据, 做好 Redis 安全漏洞的防护和灾备.
来源: https://www.cnblogs.com/tonyY/p/12175032.html