这里分别对Redis的复制、Sentinel、集群三个多机功能进行介绍。
主从复制
redis 2.8版本之前是主发送rdb文件给从实现复制的。效率较低。重连后同步,耗时。
新版本分完整同步和部分同步。完整同步和旧版一样,而部分同步则处理断线后重复制情况。
分部同步由三部分组成:
offset偏移量
复制积压缓冲区
服务器运行id
1 | struct redisServer { |
Sentinel
Sentinel是特殊状态下的redis服务器,本质不用数据库。Sentinel有它自己的命令:
1 | struct redisCommand sentinelcmds[] = { |
sentinel中的master字典记录所有被监视的主服务器相关信息
字典的键是主服务器的信息
字典的值是主服务器对应的这个结构
1 | typedef struct sentinelRedisInstance { |
当一个主服务器被判断为客观下线时,监视这个下线主服务器的各个Sentinel会进行协商,选举出一个领头Sentinel,并由领头Sentinel对下线主服务器执行故障转移操作。
- 每个发现主服务器进入客观下线的
Sentinel都会要求其他Sentinel将自己设置为局部领头SentinelSentinel设置局部领头Sentinel的规则是先到先得:最先向目标Sentinel发送设置的,会成为其局部领头Sentinel- 如果有某个
Sentinel被半数以上的Sentinel设置成了局部领头Sentinel,那么这个Sentinel成为领头Sentinel
选出新的主服务器
使用如下条件筛选备选node:
1、
slave节点状态处于S_DOWN,O_DOWN,DISCONNECTED的除外
2、最近一次ping应答时间不超过5倍ping的间隔(假如ping的间隔为1秒,则最近一次应答延迟不应超过5秒,redis sentinel默认为1秒)
3、info_refresh应答不超过3倍info_refresh的间隔(原理同2,redis sentinel默认为10秒)
4、slave节点与master节点失去联系的时间不能超过( (now - master->s_down_since_time) + (master->down_after_period * 10))。总体意思是说,slave节点与master同步太不及时的(比如新启动的节点),不应该参与被选举。
5、Slave priority不等于0(这个是在配置文件中指定,默认配置为100)。
从备选node中,按照如下顺序选择新的master
1、较低的
slave_priority(这个是在配置文件中指定,默认配置为100)
2、较大的replication offset(每个slave在与master同步后offset自动增加)
3、较小的runid(每个redis实例,都会有一个runid,通常是一个40位的随机字符串,在redis启动时设置,重复概率非常小)
4、如果以上条件都不足以区别出唯一的节点,则会看哪个slave节点处理之前master发送的command多,就选谁。
集群
参考
《redis 设计与实现》
Redis 2.9源码