无
集群下所有虚拟机显示橙色状态,点击概要界面虚拟机状态显示“HA异常”,点击处理提示:HA拷贝文件错误,虚拟机业务正常
1、首先排查后台修改root密码原因,集群所有主机下虚拟机状态都显示橙色异常;
2、执行“service cvm_ha status”和“service cvk_ha status”查看各个主机的HA功能状态是否正常;
3、集群HA功能正常开启后,HA会在后台拷贝所有虚拟机的配置信息,如果环境异常会导致HA功能在拷贝同步虚拟机配置信息时出错,尝试关闭集群HA,重新开启HA功能,提示:部分主机拷贝虚拟机配置文件失败,请处理HA异常虚拟机。尝试重启cvm_ha和cvk_ha后故障依旧,日志中有如下报错:
4、在CVM后台执行命令cha get-perf-data host –m,查看是否有报错,如果返回错误,则说明是个已知问题,可以通过重启cas_mon解决。环境中执行该命令,返回结果正常:
5、现场CAS为双机环境,双机状态显示正常,CVM主机的/etc/cvm/ha目录存在,检查软连接状态发现显示红色异常,正常环境的软连接显示如下图二,基本可以判定该问题为双机软连接异常导致。
首先确认是老热备环境还是新热备环境,以CAS E0523为分界,E0523之前的版本为老双机热备,E0523之后的版本为新双机热备。热备软连接恢复方法如下:
可以先将/etc/cvm和/root/.ssh/hosts的文件备份出来
老热备软连接恢复:
正确的软连接为:
(1)/etc/cvm -> /vms/.ssh/cvm的恢复:
主上执行:mv /etc/cvm /etc/cvm.tmp
mkdir –p /vms/.ssh/cvm
ln –sf /vms/.ssh/cvm /etc/cvm
主上重启tomcat:service tomcat8 restart
备上执行: mv /etc/cvm /etc/cvm.tmp
ln –sf /vms/.ssh/cvm /etc/cvm
执行ls -l /etc/cvm检查软连接状态
(2)/root/.ssh/hosts -> /vms/.ssh/hosts的恢复:
主上执行:
mkdir –p /vms/.ssh
mv /root/.ssh/hosts /vms/.ssh/
ln -sf /vms/.ssh/hosts /root/.ssh/hosts
备上执行: ln -sf /vms/.ssh/hosts /root/.ssh/hosts
执行ls -l /root/.ssh/hosts检查软连接状态
新热备软连接恢复:
正确的软连接为:
(1)/etc/cvm -> /var/lib/mysql-share/.ssh/cvm的恢复:
主上执行: mv /etc/cvm /etc/cvm.tmp
mkdir –p /var/lib/mysql-share/.ssh/cvm
ln –sf /var/lib/mysql-share/.ssh/cvm /etc/cvm
主上重启tomcat:service tomcat8 restart
备上执行: mv /etc/cvm /etc/cvm.tmp
ln –sf /var/lib/mysql-share/.ssh/cvm /etc/cvm
执行ls -l /etc/cvm检查软连接状态
(2)/root/.ssh/hosts -> /var/lib/mysql-share/.ssh/hosts的恢复:
主上执行: mkdir –p /var/lib/mysql-share/.ssh
mv /root/.ssh/hosts /var/lib/mysql-share/.ssh/
ln -sf /var/lib/mysql-share/.ssh/hosts /root/.ssh/hosts
备上执行: ln -sf /var/lib/mysql-share/.ssh/hosts /root/.ssh/hosts
执行ls -l /root/.ssh/hosts检查软连接状态
最后,关闭集群HA,重新启动HA后虚拟机状态显示正常,集群HA功能也恢复正常。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作