虚拟化环境中,因诸多因素需要对主机进行维护操作,修改主机信息是常常会遇到的组网变更,比如修改主机的IP地址或者主机名等。修改时一般使用iLO的remote console功能进行配置,此时发现可能会有以下两类报错:
1、主机的HA和共享文件系统进程在运行不允许修改
2、当前主机被CVM管理平台管理不允许修改
1、初步分析:
对主机的信息修改操作的一般步骤见下:
l 迁移主机上的虚拟机到其他主机
l 暂停主机上的所有共享文件系统存储池/集群关闭HA
l 集群中删除主机
l 修改主机信息后将主机添加回管理平台
l 虚拟机迁移回主机,集群开启HA
进行主机维护之前,为了不影响正常的业务虚拟机,需要把虚拟机迁移到别的主机上,然后在集群中删除主机,即可进行正常维护。如果不删除主机且集群开启HA,有一半及以上主机进行维护操作时,根据HA机制,其他不需维护的主机会认为和一半主机失去联系,自身处于脱离集群状态,把自己所管理的虚拟机全部停机,严重影响业务正常运行。
针对问题的第一类报错是修改主机信息时没有关闭HA和暂停共享文件系统,按照报错关闭和暂停即可。第二类报错当前主机被管理,此时有可能是主机确实没有被平台删除,解决方法是按照操作顺序将主机删除即可。另外,还有可能出现主机确实已经从集群中删除了,还是报这个错,这是为什么呢?此时做重启主机操作,重复添加和删除操作,还是不行。下面就专门针对主机从集群中删除仍然报错被管理的问题进行探讨。
2、 主机从集群中删除后仍然显示被管理报错原因和处理方法
该问题出现的原因可能是在CVM上做CVK主机删除操作时,此时CVK主机本身异常的情况下(比如不可达),或者此时网络不稳定,将该CVK删除了,导致CVM无法及时修正管理文件。
OK,问题原因知道了,如果破?
问题的根源就在于没有同步修改CVK的管理文件,那么解决方法自然要从CVK管理文件下手了。
请登陆到报错CVK主机的后台(可以SSH/键盘显示器直接连接服务器/使用iLO的remote console功能),执行“cat /root/.ssh/mhost”查看是否有该文件读取,如下输出表示当前CVK02主机的管理文件记录自己被CVK01管理。
root@HZ-CAS01-CVK02:/# cat /root/.ssh/mhost
HZ-CAS01-CVK01
检查到/root/.ssh/mhost文件确实存在,此时执行命令将该文件删除即可。
root@HZ-CAS01-CVK02:/# rm –rf /root/.ssh/mhost
修改主机信息是一个常规的主机维护操作,操作时候请按照操作顺序正常操作即可避免这些问题(关于主机信息变更操作顺序指导可参考KMS案例《集群主机维护案例》)。存在不允许主机信息更改的报错,这个报错其实是CAS平台做的限制也是一种保护机制,比如当修改主机管理IP地址时候没有关闭HA功能,此时对HA的心跳判断就会有影响。所以遇到报错可以从另外一个心态去看它,然后根据报错提示去操作即可。另外,关于主机从集群上删除还是显示被管理这个情况也有一个提示就是:当发现被管理的CVK主机在CVM管理平台显示异常,请先排查下异常原因,是否管理网络出现振荡,如在CAS平台重新连接一下主机看看等等。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作