Redis全量同步和增量同步原理

abc123mma · 2022-11-08 20:25:49 发布

主从第一次同步是全量同步：也就是说，当你主从节点连接建立后，需要执行一次全量同步。那么Redis如何实现全量同步呢？

其实本质就是Master 给 slave 发送其保存的RDB文件。slave读取RDB文件恢复数据

详细介绍：

【第一步】slave与master建立连接后，master判断该slave 是否是第一次建立连接。那么该如何判断呢？

其实Master和slave都有一个Replication Id，简称replid，若id一致说明是已经建立过连接了，不需要进行全量同步，则需要进行增量同步。

【第二步】master 执行bgsave，生成RDB文件，同时在生成RDB的同时，也会产生一个baklog文件记录RDB期间的命令，然后将RDB文件发送给从节点，从节点加载RDB文件中的数据。至此全量同步已经完成。

【第三步】也就是后续master和slave在进行同步时候就是增量同步。则需要利用之前生成的baklog文件。

【总结全量同步】

主从第一次同步是全量同步，但如果slave重启后同步，此时slave重启后，slave节点和master节点的数据之间有落后，因此需要进行增量同步。

【过程】

master节点和slave节点中维护了一个环形数组（前文提到的repl_baklog）和一个指针为offset。

slave来申请增量同步，带着replid和offset，然后master根据获取offset之后的数据，将其发送给slave，slave进行同步。

通过对Redis主从集群的同步介绍，可以从以下几个方面来优化Redis的主从集群

在master中配置repl-diskless-sync yes 启用无磁盘负责，来避免全量同步时的磁盘IO。（应用场景：你的磁盘传输比较慢，但是你的网络带宽很大，网络状况极好。）
Redis单节点上内存占用不要太大。减少RDB文件的大小。
适当的提高repl_baklog的大小，尽量slave恢复后做全量同步。
限制一个master上的slave节点数量，可以采用主从链的形式。