首先呢,我想先给大家简单介绍一下什么是 keepalived:
Keepalived 的作用是检测服务器的状态,如果有一台 web 服务器死机,或工作出现故障,Keepalived 将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后 Keepalived 自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
大家了解到 Keepalived 是什么东西了之后,咱们就进入主题。
1. 下载
http://www.keepalived.org/download.html
或
wget http://www.keepalived.org/software/keepalived-1.2.2.tar.gz
2. 安装
tar -zxvf keepalived-1.2.2.tar.gz
cd keepalived-1.2.2
./configure --prefix=/home/wangpl/mine/soft/keepalived-1.2.2
make && make install
补充: 在大家进行./configure 有的机器会报错,这里为大家提供一个简单的解决方案。
1. 遇到 keepalived 执行./configure --prefix=/usr/local/keepalived 时报错:configure: error: Popt libraries is required
3. 方式
- 解决方法:yum install popt - devel安装好popt的开发包。重新. / configure即可。 < span style = "color:#FF0000;" > !!在完成Keepalived之前咱们需要安装依赖包防止在接下来安装过程中出错。 < /span>
- <p align="left">yum install openssl-devel
- yum install popt-devel
- yum install ipvsadm
- yum install libnl*</p >
4. 试用
进入目录 进行启动 cd /etc/init.d/
启动:sh keepalived start
停止:sh keepalived stop
重启:sh keepalived restart
5. (主从模式)配置 keepalived.conf
- global_defs {
- notification_email {
- root@localhost
- }
- notification_email_from root@localhost smtp_server localhost smtp_connect_timeout 30 router_id NodeA
- }
默认的配置文件中,使用第三方 smtp 服务器,但这在现实中几乎没有意义(需要验证的原因),我们将其指定为 localhost, 将通知信息的发送交给本地 sendmail 服务处理。或者把其内容全部删除掉只留下 router_id NodeA。查阅说明文档得知 route_id 配置是为了标识当前节点,我将其设置为 NodeA。当然两个节点的此项设置可相同,也可不相同。
按同样的方法配置节点 B 并修改配置文件,可将 A 节点的配置文件复制到 B 节点,并修改以下几项:
- vrrp_instance VI_1 {
- state MASTER#指定A节点为主节点备用节点上设置为BACKUP即可interface eth0#绑定虚拟IP的网络接口virtual_router_id 51#VRRP组名,两个节点的设置必须一样,以指明各个节点属于同一VRRP组priority 100#主节点的优先级(1 - 254之间),备用节点必须比主节点优先级低advert_int 1#组播信息发送间隔,两个节点设置必须一样authentication {#设置验证信息,两个节点必须一致auth_type PASS auth_pass 1111
- }
- virtual_ipaddress {#指定虚拟IP,
- 两个节点设置必须一样192.168.200.16 / 24#VIP虚拟IP 192.168.200.17 / 24#主服务器IP 192.168.200.18 / 24#从服务器IP
- }
- }
router_id NodeB
state BACKUP
priority 99
其它项不必修改。
测试及验证:
执行命令 ip a (注意 ifconfig 命令无法查看到配置的虚拟 IP),来查看。
6.(主从模式)脑裂问题
上述主从配置方式存在脑裂的可能,即两个节点实际都处于正常工作状态,但是无法接收到彼此的组播通知,这时两个节点均强行绑定虚拟 IP,导致不可预料的后果。
这时就需要设置仲裁,即每个节点必须判断自身的状态(应用服务状态及自身网络状态),要实现这两点可使用自定义 shell 脚本实现,通过周期性地检查自身应用服务状态,并不断 ping 网关(或其它可靠的参考 IP)均可。当自身服务异常、或无法 ping 通网关,则认为自身出现故障,就应该移除掉虚拟 IP(停止 keepalived 服务即可)。主要借助 keepalived 提供的 vrrp_script 及 track_script 实现:
- vrrp_script check_local {#定义一个名称为check_local的检查脚本script "/usr/local/keepalived/bin/check_local.sh"#shell脚本的路径interval 5#运行间隔
- }
- track_script {
- check_local
- }
我们在 / usr/local/keepalived/bin/check_local.sh 定义的检测规则可以是:
以上的路径及文件是自己定义的。
a. 自身 web 服务故障(超时,http 返回状态不是 200)
b. 无法 ping 通网关
c. 产生以上任何一个问题,均应该移除本机的虚拟 IP(停止 keepalived 实例即可)
但这里有个小问题,如果本机或是网关偶尔出现一次故障,那么我们不能认为是服务故障。更好的做法是如果连续 N 次检测本机服务不正常或连接 N 次无法 ping 通网关,才认为是故障产生,才需要进行故障转移。另一方面,如果脚本检测到故障产生,并停止掉了 keepalived 服务,那么当故障恢复后,keepalived 是无法自动恢复的。我觉得利用独立的脚本以秒级的间隔检查自身服务及网关连接性,再根据故障情况控制 keepalived 的运行或是停止。
这里提供一个思路,具体脚本内容请大家根据自己的需要编写即可。脚本 / usr/local/nginx/check_nginx.sh" 内容:
- # ! /bin/bash
- if ["$(ps -ef | grep "nginx: master process "| grep -v grep )" == ""] then / usr / local / nginx / sbin / nginx sleep 5
- if ["$(ps -ef | grep "nginx: master process "| grep -v grep )" == ""] then killall keepalived fi fi
// 如果以上配置我介绍的不理解的话 大家参考一下实例代码。
vi /etc/keepalived/keepalived.conf
编辑文件(主):
- global_defs {
- router_id nginx_master
- }#监控服务.NGINX mysql等vrrp_script chk_nginx {
- script "/usr/local/nginx/check_nginx.sh"interval 2 weight 2
- }
- vrrp_instance VI_1 {
- state MASTER interface eth0 virtual_router_id 51 priority 101 advert_int 1 authentication {
- auth_type PASS auth_pass 1111
- }
- virtual_ipaddress {
- 192.168.xx.xx#VIP(虚拟ip)192.168.xx.xx#主服务器IP 192.168.xx.xx#从服务器IP
- }
- track_script {
- chk_nginx#检测脚本上面配置的
- }
- }
vi /etc/keepalived/keepalived.conf
编辑文件(从):
- global_defs {
- router_id nginx_backup
- }#监控服务.NGINX mysql等vrrp_script chk_nginx {
- script "/usr/local/nginx/check_nginx.sh"interval 2 weight 2
- }
- vrrp_instance VI_1 {
- state BACKUP interface eth0 virtual_router_id 51 priority 99 advert_int 1 authentication {
- auth_type PASS auth_pass 1111
- }
- virtual_ipaddress {
- 192.168.xx.xx#VIP(虚拟ip)192.168.xx.xx#主服务器IP 192.168.xx.xx#从服务器IP
- }
- track_script {
- chk_nginx#检测脚本上面配置的
- }
- }
来源: http://lib.csdn.net/article/linux/47237