现场环境CAS E0535P12版本,前台告警界面有一台主机一直不停的在报“主机自动进入维护模式”的告警:
查看告警信息发现,该告警一直不断的持续了10天,并且每隔十几秒就会告警一次。
1、后台查看 cas.log 日志,找到对应的时间点,发现对应告警时间点 cas.log 无异常打印;
2、查看 cas_mon.log 日志,发现该日志一直都在打印如下信息:
3、进入告警的CVK主机后台,查看系统日志,发现从最初一次告警开始,之后每次告警对应的时间点都会有如下日志打印:
初步怀疑可能是跟集群的 ha 有关系。
4、前台关闭再启动集群的 ha 发现依然告警,尝试前台连接主机,后台重启 cvm_ha 、cas_mon 服务告警依然存在。
5、使用 CAS 金手指工具对环境进行巡检,结果发现环境中存在幽灵虚拟机,并且是在该告警 CVK 主机上的,但处于关机状态。因此怀疑该告警是因为幽灵虚拟机导致的,需要尽快对幽灵虚拟机进行处理。
参考《幽灵虚拟机处理方法》的操作文档,对环境的幽灵虚拟机进行处理,之后再对环境进行观察,发现该告警消失。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作