简述keepalived工作原理

简述keepalived工作原理1VRRPVRRP（Virtual Router Redundancy Protocol）：虚拟路由冗余协议，解决静态网关单点故障风险，它能够保证当个别节点宕机时，整个网络可以不间断地运行。物理层：路由器、三层交换机软件层：keepalived1.1VRRP相关术语虚拟路由器：Virtual Router虚拟路由器标识：VRID（0-255），唯一标识虚拟路由器VI

一直在努力学习的菜鸟

5001人浏览 · 2022-04-15 22:08:33

一直在努力学习的菜鸟 · 2022-04-15 22:08:33 发布

简述keepalived工作原理

1VRRP

VRRP（Virtual Router Redundancy Protocol）：虚拟路由冗余协议，解决静态网关单点故障风险，它能够保证当个别节点宕机时，整个网络可以不间断地运行。

物理层：路由器、三层交换机
软件层：keepalived

1.1VRRP相关术语

虚拟路由器：Virtual Router
虚拟路由器标识：VRID（0-255），唯一标识虚拟路由器
VIP：Virtual IP，虚拟路由器的IP地址
VMAC：Virutal MAC (00-00-5e-00-01-VRID)
物理路由器：
master：主设备，虚拟路由器中承担报文转发任务的路由器
backup：备用设备，master路由器出现故障时，能够代替master路由器工作的路由器
priority：优先级，VRRP根据优先级来确定虚拟路由器中每台路由器的地位。

1.2VRRP相关技术

通告：心跳，优先级等；周期性
工作方式：抢占式，非抢占式

抢占模式：在抢占模式下，如果Backup设备的优先级比当前Master设备的优先级高，则主动将自己切换成Master。
非抢占模式：在非抢占模式下，只要Master设备没有出现故障，Backup设备即使随后被配置了更高的优先级也不会成为Master设备。

安全认证：
无认证：不进行任何VRRP报文的合法性认证，不提供安全性保障
简单字符认证：预共享密钥，在一个有可能受到安全威胁的网络中，可以将认证方式设置为简单字符认证
MD5认证：在一个非常不安全的网络中，可以将认证方式设置为MD5认证

工作模式：

主/备：单虚拟路由器
主/主：主/备（虚拟路由器1），备/主（虚拟路由器2）

1.3VRRP工作过程

VRRP的工作过程如下：

（1）VRRP备份组中的设备根据优先级选举出Master。Master设备通过发送免费ARP报文，将虚拟MAC地址通知给与它连接的设备或者主机，从而承担报文转发任务。

（2）Master设备周期性向备份组内所有Backup设备发送VRRP通告报文，以公布其配置信息（优先级等）和工作状况。

（3）如果Master设备出现故障，VRRP备份组中的Backup设备将根据优先级重新选举新的Master。

（4）VRRP备份组状态切换时，Master设备由一台设备切换为另外一台设备，新的Master设备会立即发送携带虚拟路由器的虚拟MAC地址和虚拟IP地址信息的免费ARP报文，刷新与它连接的主机或设备中的MAC表项，从而把用户流量引到新的Master设备上来，整个过程对用户完全透明。

（5）原Master设备故障恢复时，若该设备为IP地址拥有者（优先级为255），将直接切换至Master状态。若该设备优先级小于255，将首先切换至Backup状态，且其优先级恢复为故障前配置的优先级。

（6）Backup设备的优先级高于Master设备时，由Backup设备的工作方式（抢占方式和非抢占方式）决定是否重新选举Master。

2keepalived介绍

keepalived基于VRRP协议的软件实现，原生设计目的为了高可用 ipvs服务

ipvs，IP虚拟服务器（IP Virtual Server，简写为IPVS）。是运行在LVS下的提供负载均衡功能的一种技术。

keepalived的功能：

基于vrrp协议完成地址流动
为vip地址所在的节点生成ipvs规则(在配置文件中预先定义)
为ipvs集群的各RS（后端的Real Server）做健康状态检测
基于脚本调用接口完成脚本中定义的功能，进而影响集群事务，以此支持nginx、haproxy等服务

2.1Keepalived架构

用户空间核心组件：
vrrp stack：VIP消息通告
checkers：监测real server
system call：实现 vrrp 协议状态转换时调用脚本的功能
SMTP：邮件组件
IPVS wrapper：生成IPVS规则
Netlink Reflector：网络接口
WatchDog：监控进程
控制组件：提供keepalived.conf 的解析器，完成Keepalived配置
IO复用器：针对网络目的而优化的自己的线程抽象
内存管理组件：为某些通用的内存管理功能（例如分配，重新分配，发布等）提供访问权限

3keepalived的工作原理

Keepalived高可用对之间是通过VRRP进行通信的，VRRP是通过竞选机制来确定主备节点的，主节点的优先级高于备节点，因此，工作时主节点会优先获得所有的资源，备节点处于等待状态，当主节点出现故障时，备节点就会接管主节点的资源，然后顶替主节点对外提供服务。

在Keepalived服务对之间，只有作为主节点的服务器会一直发送 VRRP广播包，告诉备节点它还活着，此时备节点不会抢占主节点资源，当主节点不可用时，即备节点监听不到主节点发送的广播包时，备节点就会启动相关服务接管主节点的资源，保证业务的连续性。接管速度最快可以小于1秒。

3.1Keepalived高可用故障切换转移原理

Keepalived高可用服务之间的故障切换转移，还是通过VRRP（Vritual Route Redundancy Protocol，虚拟路由冗余协议）来实现的。

在Keepalived服务正常工作时，Master主节点会不断向Backup备节点发送心跳消息（多播的方式），用来告诉备用节点自己还活着，当Master主节点出现故障时，就无法发送心跳消息，备节点也就因此无法继续检测到来自Master主节点的心跳消息了，于是调用自身的接管程序，接管Master主节点的IP资源及服务。而当Master主节点恢复时，Backup备节点默认又会主动释放主节点故障时自身接管的IP资源及服务，恢复到原来的备用角色。

4脑裂

4.1什么是脑裂？

在高可用（HA）系统中，当联系2个节点的“心跳线”断开时，本来为一整体、动作协调的HA系统，就分裂成为2个独立的个体。
由于相互失去了联系，都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样，争抢“共享资源”、争起“应用服务”，就会发生严重后果。共享资源被瓜分、两边“服务”都起不来了；或者两边“服务”都起来了，但同时读写“共享存储”，导致数据损坏