一, 持久化
所谓的持久化就是把内存中的数据写到磁盘中去, 防止服务宕机后内存数据丢失. Redis4.0 之前提供了两种持久化方式: RDB(默认) 和 AOF,Redis4.x 之后新增了一种混合持久化(本文所用的 Redis 版本是 Redis-5.0.2)
1,RDB
RDB 是 Redis Database 缩写, 在默认情况下, Redis 将内存数据库快照保存在名字为 dump.rdb 的二进制文件中. 可以对 Redis 进行设置, 让它在 "N 秒内至少有 M 个键值改动" 这一条件被满足时, 自动保存一次数据. 比如下图, 900 秒内有 1 个键值或者 300 秒内有 10 个键值或者 60 秒内有 10000 个键值改动, 自动保存一次数据; 关闭 RDB 只需要将所有的 save 保存策略注释掉即可.
还可以手动执行命令生成 RDB 快照, 进入 Redis 客户端执行命令 save 或 bgsave 可以生成 dump.rdb 文件, 每次命令执行都会将所有 Redis 内存快照到一个新的 rdb 文件里, 并覆盖原有 rdb 快照文件. save 是同步命令, bgsave 是异步命令, bgsave 会从 Redis 主进程 fork(fork()是 Linux 函数)出一个子进程专门用来生成 rdb 快照文件. Redis 配置自动生成 rdb 文件后台使用的是 bgsave 方式.
命令 | save | bgsave |
IO 类型 | 同步 | 异步 |
是否阻塞 redis 其它命令 | 是 | 否 (在生成子进程执行调用 fork 函数时会短暂阻塞) |
复杂度 | O(n) | O(n) |
优点 | 不会消耗额外内存 | 不阻塞客户端命令 |
缺点 | 阻塞客户端命令 | 需要 fork 子进程,消耗内存 |
2,AOF
AOF 是 append-only file 缩写, RDB 快照并不是非常耐久(durable): 如果 Redis 因为某些原因而造成故障停机, 那么服务器将丢失最近写入, 且仍未保存到快照中的那些数据. 从 Redis1.1 版本开始, Redis 增加了一种完全耐久的持久化方式: AOF 持久化. 可以通过修改如下配置文件来打开 AOF 功能:
修改了配置文件, 先执行 bin/Redis-cli shutdown 停止 Redis, 然后执行 bin/Redis-server Redis.conf 启动 Redis, 此时 appendonly 生效; 从现在开始, 每当 Redis 执行一个改变键值的命令时(比如 SET), 这个命令就会被追加到 AOF 文件的末尾. 这样的话, 当 Redis 重新启动时, 程序就可以通过重新执行 AOF 文件中的命令来达到重建数据的目的. 你可以配置 Redis 多久才将数据 fsync 到磁盘一次.
1 appendfsync always: 每次有新命令追加到 AOF 文件时就执行一次 fsync, 非常慢, 也非常安全.
2 appendfsync everysec: 每秒 fsync 一次, 足够快(和使用 RDB 持久化差不多), 并且在故障时只会丢失 1 秒钟的数据.
3 appendfsync no: 从不 fsync, 将数据交给操作系统来处理. 更快, 也更不安全的选择.
推荐 (并且也是默认) 的措施为每秒 fsync 一次, 这种 fsync 策略可以兼顾速度和安全性. 配置文件如下:
执行如下命令:
(1)启动客户端, 连接 Redis bin/Redis-cli 并执行 set toby xu
(2) 到 dir(Redis.conf 这个配置文件里面的数据持久化的目录属性)所在的目录下查看, 如下图:
(3)VIM appendonly.aof, 文件的内容在后面的 RESP(Redis 序列化协议)中详解讲解, Redis 序列化协议官网地址: https://redis.io/topics/protocol
AOF 重写:
(1)AOF 文件里可能有太多没用指令, 所以 AOF 会定期根据内存的最新数据生成新的 aof 文件, 当然可以手工执行 bgrewriteaof 命令也能重写 AOF, 比如执行如下命令:
(2)重写后 AOF 文件里变成:
如下两个配置可以控制 AOF 自动重写频率:
1 auto-aof-rewrite-min-size 64mb :aof 文件至少要达到 64M 才会自动重写.
2 auto-aof-rewrite-percentage 100 :aof 文件自上一次重写后文件大小增长了 100% 则再次触发重写.
当然 AOF 还可以手动重写, 进入 Redis 客户端执行如上图命令 bgrewriteaof 重写 AOF 注意, AOF 重写 Redis 会 fork 出一个子进程去做, 不会对 Redis 正常命令处理有太多影响.
3,RDB 和 AOF 对比
Redis 启动时如果既有 RDB 文件又有 AOF 文件则优先选择 AOF 文件恢复数据, 因为 AOF 一般来说数据更全一点.
持久化方式 | RDB | AOF |
启动优先级 | 低 | 高 |
文件大小 | 小 | 大 |
恢复速度 | 快 | 慢 |
数据安全性 | 容易丢数据 | 根据策略决定 |
4,Redis4.0 混合持久化
重启 Redis 时, 我们很少使用 RDB 来恢复内存状态, 因为会丢失大量数据. 我们通常使用 AOF 日志重放, 但是重放 AOF 日志性能相对 RDB 来说要慢很多, 这样在 Redis 实例很大的情况下, 启动需要花费很长的时间. Redis4.0 为了解决这个问题, 带来了一个新的持久化选项 -- 混合持久化. 配置如下:
如果开启了混合持久化, AOF 在重写时, 不再是单纯将内存数据转换为 RESP 命令写入 AOF 文件, 而是将重写这一刻之前的内存做 RDB 快照处理, 并且将 RDB 快照内容和增量的 AOF 修改内存数据的命令存在一起, 都写入新的 AOF 文件, 新的文件一开始不叫 appendonly.aof, 等到重写完新的 AOF 文件才会进行改名, 原子的覆盖原有的 AOF 文件, 完成新旧两个 AOF 文件的替换. 于是在 Redis 重启的时候, 可以先加载 RDB 的内容, 然后再重放增量 AOF 文件就可以完全替代之前的 AOF 全量文件重放, 因此重启效率大幅得到提升.
二, Redis 主从
1, 主从复制概念
主从复制, 是指将一台 Redis 服务器的数据, 复制到其他的 Redis 服务器. 前者称为主节点(master), 后者称为从节点(slave), 数据的复制是单向的, 只能由主节点到从节点.
2, 主从复制的原理
(1)全量复制
将主节点中的所有数据都发送给从节点, 是一个非常重型的操作, 当数据量较大时, 会对主从节点和网络造成很大的开销. 全量复制流程图如下:
1 slave 会发出一个同步命令, 刚开始是 Psync 命令, 表示要求 master 主机同步数据
2 master 收到 psync 命令后, 会通过执行 bgsave 生成最新的 RDB 快照文件, 持久化期间, master 会继续接收客户端的请求, 它会把写请求缓存在内存中
3 发送 RDB 文件给 slave
4 master 再将之前缓存在内存中的命令发送给 slave
5 刷新旧的数据. slave 在载入主节点的数据之前要先将老数据清除
6 加载 RDB 文件将数据库状态更新至主节点执行 bgsave 时的数据库状态和缓冲区数据的加载
7 master 同步长连接持续把写命令发送给 slave, 以保证数据的一致
(2)部分复制
部分复制是 Redis 2.8 以后出现的, 用于处理在主从复制中因网络闪断等原因造成的数据丢失场景, 当 slave 再次连上 master 后, 如果条件允许, master 会补发丢失数据给 slave. 因为补发的数据远远小于全量数据, 可以有效避免全量复制的过高开销. 部分复制流程图如下:
1 如果网络抖动(连接断开 connection lost)
2 master 还是会写 repl_back_buffer(复制缓冲区)
3 slave 会继续尝试连接主机
4 slave 会把自己当前 run_id 和偏移量传输给 master, 并且执行 pysnc 命令同步
5 slave 发送过来的 offset 在 repl_back_buffer 中, 则 master 会将缓存中从 offset 以后的数据一次性同步给 slave, 否则全量复制
6 master 同步长连接持续把写命令发送给 slave, 以保证数据的一致
3, 主从搭建
其中 slave 的主要配置如下:
- port 6380
- pidfile /var/run/redis_6380.pid
- dir /usr/local/Redis-5.0.2/6380
- replicaof 192.168.160.146 6379
- replica-serve-stale-data yes
- replica-read-only yes
(1)在 6379 set toby xu
(2)在 6380 keys *
至此 Redis 主从搭建完成!!!!!