keepalived

一、原理：

　　功能：能够自动实现将用户访问的ip转移的方法，故障重启，故障，恢复切换，故障报警

　　模型：Master/Backup

　　使用场景：节点少，没有共享存储等等。他只能有一个主活动，其他为从节点

功能实现：

Master不停的向Backup进行心跳通告，一旦心跳停止就迁移VIP。

Keepalived是模块化，主要是给LVS提供高可用性，并且可以向后端的Realserver提供健康状态检查，还可以通过脚本对特定服务进行健康检查，故障重启及切换。

keepalived核心：

　　　　vrrp:虚拟冗余路由协议

　　　　　　 KEEPALIVED

　　　　VRRP有限状态机

KEEPALIVED

　　　　为了解决ip漂移后mac地址也变化了，IP地址和MAC地址都是虚拟的（VMAC），通过心跳检测的良好状态进行转移也可以降低优先级进行故障转移（0-255 ，数字越大优先级越高）

　　　　virtual server

　　　　vrrp_script：

　　　　监控服务的健康状态。根据服务的状态故障转移

Keepalived架构图：

　　 KEEPALIVED

　　Configure file parser 配置文件检测，主进程负责分析配置文件

　　I/O Multiplexer ， io多路复用

　　watchdog ：监控两个进程健康状态，负责启动，重启两个紫禁城

　　两个子进程：真正工作的子进程

　　　　Checkers：自身的IPVS的后端服务器的健康状态

　　　　　　　用户提供脚本

　　　　VRRP：

　　VRRP认证机制：1、明文认证， 2、hmac认证

二、安装及配置

1、http://keepalived.org/ 下载软件或在Centos 6.4以后可以yum安装

ansible two -m yum -a "name=keepalived state=installed"

2、Keepalived文件

　　/etc/keepalived/keepalive.conf

　　/etc/init.d/keepalived

3、同步时间

ansible all  -a 'ntpdate s1a.time.edu.cn'

4、备份配置文件

ansible two -a "cp /etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf.bak"

man Keepalived.conf

! Configuration File for keepalived   #这部分配置好了就可以启动，Keepalived就开始互相监听Keepalived服务了。

global_defs {             #全局配置 ，主要是通知机制及静态路由配置，还可以定义静态路由，但非必要，所以这里没给默认值

   notification_email {　　　　　　　　#收件人

     #acassen@firewall.loc       #这三个均为收件人

     #failover@firewall.loc

     #sysadmin@firewall.loc
　　  #

   }

   notification_email_from Alexandre.Cassen@firewall.loc    #发件人

   smtp_server 192.168.200.1　　　　　　　  #发件服务器

   smtp_connect_timeout 30　　　　　　　　　#发件连接超时　

   router_id LVS_DEVEL　　　　　　　　　　　 #路由器标示，随便给一个字符串　　　　　　

}

  vrrp_script chk_svr_down {   #vrrp定义检测判断脚本 ， chk_svr_down 是脚本名称，随便取

  　　script "[[ -f /etc/keepalived/down ]]" && exit 1 || exit 0"        #这里可以去读取脚本，或者用引号括起来的一个命令  返回1执行下面额weight -2

  　　interval 1        #每隔1秒钟检测一次

  　　weight  -2　　　　 #如果脚本检测成功权重 - 2

　}

vrrp_instance VI_1 { . #配置vrrpd 定义虚拟路由器 VI_1 虚拟路由的标示名称，随意取名 state MASTER #初始状态，这里定义了master了其priority的值就要高于其他节点 
　　 state MASTER       #定义主，可以不定义
　　 interface eth0          #通告选举通过那个网卡进行

    virtual_router_id 51    #虚拟路由ID，每个虚拟路由都需要有id号，vmac的最后一段地址，最大255,一套Keepalived 应该是相同的id

    priority 100　　　　　　　#初始优先级,高的为master，高的会在恢复的时候抢过来

    advert_int 1　　　　　　　#通告时间间隔

    authentication {　　　　 #认证机制

        auth_type PASS　　　 #明文机制　，或者ssl认证　　　

        auth_pass 1111　　　#认证密码

    }

    virtual_ipaddress {　　　　#VIP地址

        192.168.200.16

       　#定义ip格式 <IPADDR>/<MASK> brd <IPADDR>   dev <STRING>     scope <SCOPE> 　　　lable <LABLE>
　　　　　#　　　　　　　IP　　　　MASK　　　广播地址　　 工作在那块网卡上  工作范围：外网是否可见       网卡别名
　　　　              可以定义多个vip    #192.168.200.17/24 dev eth1     　　　　　　　　　　　　 #定义的格式，可以指定多个option
　　　　　　　　       　　              #192.168.200.18/24 dev eth2 label eth2:1
　}
　 track_script {   #这里面追踪上面的脚本,才真正执行上面的脚本
　　　　chk_svr_down
　　　　[可以是多个。。。]
　　}

vrrp_instance VI_2 {   #可以定义两套vrrp路由协议，做成双主，互相切换，前段通过DNS多个A记录达到分摊负载的作用
　　interface eth0

    virtual_router_id 52

    priority 99　　　　　　　

    advert_int 1　　　　　　　

    authentication {　　　　

        auth_type PASS　　　 　　　

        auth_pass 2222　　　

    }

    virtual_ipaddress {

        192.168.200.17

       　#定义ip格式 <IPADDR>/<MASK> brd <IPADDR>   dev <STRING>     scope <SCOPE> 　　　lable <LABLE>
　　　　　#　　　　　　　IP　　　　MASK　　　广播地址　　 工作在那块网卡上  工作范围：外网是否可见       网卡别名
　　　　              #192.168.200.17/24 dev eth1
　　　　　　　　       #192.168.200.18/24 dev eth2 label eth2:1
　}
　 track_script {
　　　　chk_svr_down
　　　　[可以是多个。。。]

　  notify_master "/path/to/file.sh master"    #转变成master 通知，代参数（有空白字符）需要有引号
    notify_backup "/path/to/file.sh backup"    #转变成backup 通知
    notify_fault "/path/to/file.sh fault"      #转变成失败通知

    notify /path/notify.sh   #自写脚本应付所有的通知
　　　　　　#脚本的格式 $1 指明白是  GROUP | instance  哪个配置段中
　　　　　　#          $2  说明是哪个 name of group or instance  #说明是哪个group 或者instance 
　　       #          $3  转换状态说明
　　}
   #调取脚本发通知或执行

virtual_server 192.168.56.100 80 { LVS 配置段支持 virtual server group 和 virtual server
　　　　delay_loop 6
　　　　lb_algo rr
　　　　lb_kind DR
　　　　persistence_timeout 50
　　　　protocol TCP

　　　　#sorry_server 192.168.200.200 1358

　　　　real_server 192.168.56.2 80 {
　　　　weight 1
　　　　TCP_CHECK {
　　　　connect_timeout 10
　　　　nb_get_retry 3
　　　　delay_before_retry 3
　　　　connect_port 80
　　　　}
　　}
　　　　real_server 192.168.56.3 80 {
　　　　weight 1
　　　　TCP_CHECK {
　　　　connect_timeout 10
　　　　nb_get_retry 3
　　　　delay_before_retry 3
　　　　connect_port 80
　　　　}
　　}

Dec  :: vm2 kernel: IPVS: Registered protocols (TCP, UDP, SCTP, AH, ESP)

Dec  :: vm2 kernel: IPVS: Connection hash table configured (size=, memory=64Kbytes)

Dec  :: vm2 kernel: IPVS: ipvs loaded.

Dec  :: vm2 Keepalived_healthcheckers[]: Netlink reflector reports IP 10.0.2.5 added

Dec  :: vm2 Keepalived_healthcheckers[]: Netlink reflector reports IP 192.168.56.4 added

Dec  :: vm2 Keepalived_healthcheckers[]: Netlink reflector reports IP fe80::a00:27ff:fee5:3c84 added

Dec  :: vm2 Keepalived_healthcheckers[]: Netlink reflector reports IP fe80::a00:27ff:fea9:ff31 added

Dec  :: vm2 Keepalived_healthcheckers[]: Registering Kernel netlink reflector

Dec  :: vm2 Keepalived_healthcheckers[]: Registering Kernel netlink command channel

Dec  :: vm2 Keepalived_vrrp[]: Opening file '/etc/keepalived/keepalived.conf'.

Dec  :: vm2 Keepalived_vrrp[]: Configuration is using :  Bytes

Dec  :: vm2 Keepalived_vrrp[]: Using LinkWatch kernel netlink reflector...

Dec  :: vm2 Keepalived_healthcheckers[]: Opening file '/etc/keepalived/keepalived.conf'.

Dec  :: vm2 Keepalived_healthcheckers[]: Configuration is using :  Bytes

Dec  :: vm2 Keepalived_healthcheckers[]: Using LinkWatch kernel netlink reflector...

Dec  :: vm2 Keepalived_vrrp[]: VRRP sockpool: [ifindex(), proto(), unicast(), fd(,)]

Dec  :: vm2 Keepalived_vrrp[]: VRRP_Instance(VI_1) Transition to MASTER STATE

Dec  :: vm2 Keepalived_vrrp[]: VRRP_Instance(VI_1) Entering MASTER STATE

Dec  :: vm2 Keepalived_vrrp[]: VRRP_Instance(VI_1) setting protocol VIPs.

Dec  :: vm2 Keepalived_vrrp[]: VRRP_Instance(VI_1) Sending gratuitous ARPs on eth0 for 192.168.56.6

Dec  :: vm2 Keepalived_healthcheckers[]: Netlink reflector reports IP 192.168.56.6 added

Dec  :: vm2 Keepalived_vrrp[]: VRRP_Instance(VI_1) Sending gratuitous ARPs on eth0 for 192.168.56.6

/var/log/message 日志信息

: lo: <LOOPBACK,UP,LOWER_UP> mtu  qdisc noqueue state UNKNOWN

    link/loopback ::::: brd :::::

    inet 127.0.0.1/ scope host lo

    inet6 ::/ scope host

       valid_lft forever preferred_lft forever

: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu  qdisc pfifo_fast state UP qlen

    link/ether :::e5:3c: brd ff:ff:ff:ff:ff:ff

    inet 10.0.2.5/ brd 10.0.2.255 scope global eth0

    inet 192.168.56.6/ scope global eth0

    inet6 fe80::a00:27ff:fee5:3c84/ scope link

       valid_lft forever preferred_lft forever

: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu  qdisc pfifo_fast state UP qlen

    link/ether :::a9:ff: brd ff:ff:ff:ff:ff:ff

    inet 192.168.56.4/ brd 192.168.56.255 scope global eth1

    inet6 fe80::a00:27ff:fea9:ff31/ scope link

       valid_lft forever preferred_lft forever

使用ip命令查看vip

ip位置在eth0上，看着不爽，改到eth1上

  virtual_ipaddress {

        192.168.56.6 dev eth1

    }

keepalived 心跳地址：224.0.0.1

现在就可以实现Keepalived服务及主机宕机故障恢复的切换了。（因为优先级高的原因，默认下Keepalived的 VRRP工作在抢占模式）

5、vrrp_script 脚本检测

vrrp_script chk_svr_down {   定义脚本

  script "[[ -f /etc/keepalived/down ]]" && exit 1 || exit 0"   #可以是引号中的判断命令，也可以是个脚本路径 返回1执行下面的操作
　　  interval 2       #1s 检测一次

  　　weight  -2　　　　 #权重 -2
  　　fall 2           #失败2次才下线
  　　rise 2           #成功2次才上线

　　}

vrrp_script chk_nginx {

　　scrip "killall -0 nginx"  #检查nginx
   interval 2
   weight -2
　  fall 2
    rise 2
}

 　　track_scropt {   #引用脚本
　　　　　　chk_svr_down
　　　　　　[可以是多个]
　　　　　　chk_nginx　
     }

*但是有多个检测可能因为权重值得原因服务不切换

*如果两边都有例子中的文件，则不切换，一旦一个服务器没有了这个文件，立刻转移过去,并且master一旦恢复也会切换过来　

ipvsadm

ipvsadm  -A -t [tcp|udp|fwm] 192.168.50.100:80 -s rr [ -p 持久连接时间 ]
ipvsadm  -a -t [tcp|udp|fwm] 192.168.50.100:80 -r 10.0.5.10 -g -w rr


virtual_server 10.0.50.10  {    #虚拟服务器  #这个ip就是vip , 80是客户端访问的端口  ，防火墙的标记 ： virtual_server fwmark int ,组 virtual_server group string

delay_loop

lb_algo rr          #lvs 调取算法 [ rr|wrr|lc|wlc|lblc|sh|dh|... ]

lb_kind NAT         #策略 NAT|DR|TUN

nat_mask 255.255.255.0

persistence_timeout 50   #支持持久连接的时间

protocol TCP
sorry_server 192.168.200.200 1358  ， #所有服务器全挂了

real_server 192.168.201.100  { #real 地址 端口 weight 1　　　　　　　　#权重
notify_up  "script"   #脚本通知
notify_down "script"  #脚本通知

SSL_GET|HTTP_GET|{  #监控状态检测， tcp_check tcp检测，ssl_check 检测ssl服务器，smtp检测邮件服务器，misc 不便归类的方式。

url {

　　path /

　　digest ff20ad2481f97b1754ef3e12ecd3a9cc  #通过校验码比较

　　} 
url { 　　
   path /mrtg/  
　　#status_code  200  #或者使用返回码

　　}
connect_port <port>  #realserver 发起检测的端口
bindto <ipaddr> #发起检测ip的端口

　　connect_timeout 3  #连接超时时间

　　nb_get_retry 3    #尝试几次

　　delay_before_retry 3    #每次尝试之前等待时间

　}

}

}

virtual_server 10.10.10.2   {

delay_loop

lb_algo rr

lb_kind NAT

persistence_timeout

protocol TCP

sorry_server 192.168.200.200 1358  ， #所有服务器全挂了

real_server 192.168.200.2  {

weight

TCP_CHECK { #tcp_check 只有以下检测选项

　　connect_port <port>
　　bindto <ipaddr>
　　connect_timeout

   }

 }

}

配置文件层次：

GLOBL CONFIGURATION . 　　　　　　　　#全局配置文件

　 Global definitons　　　　　　　　#全局配置

　　static route　　　　　　　　　　　　　 #静态路径

VRRPD CONFIGURATION 　　　　　　　　#配合vrrp子进程工作协议的，双主需要在这里定义两个路由，路由标示

　　VRRP synchronization group　　　　　　#同步组，在一个节点上配置了2个VIP，一同转移时　　

　　　　string ，name of group of ips that falover together

　　VRRP instace（s） #vrrp实例：核心，优先级等在这配置

　　　　Describes the moveable IP for each instance of a group in vrrp_sync_group . #转移ip地址

LVS CONFIGUATION

　　Virtual server group #虚拟路由服务器组

　　Virtual server　　　　 #虚拟服务器

*下划线的用的比较多

通知：

位置

1、vrrp_instance {

}

2、vrrp_sync_groyp{

}

通知脚本类型：

1.分开通知，每种状态触发不同脚本

# to MASTER transition

notify_master /path/to_master.sh

# to BACKUP transition
notify_backup /path/to_backup.sh
# FAULT transition
notify_fault "/path/fault.sh VG_1"

2.一个脚本应付3中状态，但是需要接受参数

# arguments
# $1 = "GROUP"|"INSTANCE" #明确用在group中还是instance中
# $2 = name of group or instance　 #说明那个group or instence　
# $3 = target state of transition　　　　#说明转换成什么状态
# ("MASTER"|"BACKUP"|"FAULT")
notify /path/notify.sh

单个版本

#！/bin/bash

vip=192.168.5.1

content="root@localhost"

notify () {

　　mailbody="vrrp tansaction, $vip floated to `hostname`"

　　subject="`hostname` is $vip MASTER"

　　echo $mailbody | mail -s $subject $content

}

notify

状态转换到master通知脚本

通用版本

vip=192.168.56.100

contact="root@localhost"

notify() {

    mailsubject="`hostname` to be $1: $vip floating"

    mailbody="`date +%F` : vrrp transition, `hostname` changed to be $1"

    echo $mailbody | mail -s "$mailsubject" $contact

}

case "$1" in

    master)

        notify master

        exit

    ;;

    backup)

        notify backup

        /etc/init.d/nginx restart  #只是在Keepalived 监控本机的nginx

        exit

    ;;

    fault)

        notify fault

        exit

    ;;

esac

通用脚本，具备重启服务

KEEPALIVED

秒客网

KEEPALIVED

keepalived

一、原理：

二、安装及配置

相关文章