CAS平台中,“概览列表资源消失”与“虚拟机无法迁移”这两个现象看似独立,但常常由同一个根因引发。
主要可以归纳为权限与授权、CAS核心服务异常、主机与存储故障三个方向:
权限与授权配置:这是“资源消失”最常见的原因。如果当前账户未被授予资源查看权限,或资源分组授权配置错误,则会在概览列表中看不到主机、存储等资源-26。若资源不可见,迁移操作自然无法执行。
CAS核心服务与组件异常:如果多个用户都遇到同样问题,很可能是CVM(Cloud Virtualization Manager,虚拟化管理平台)相关服务异常或CVK(Cloud Virtualization Kernel,虚拟化内核系统)节点故障。具体表现为:
CVM的Tomcat或CAS服务故障:可能导致前端界面加载异常,资源列表显示失败。
caserver内存溢出:这是CAS 7.0部分版本的已知问题,会导致Web界面显示不全或功能卡顿。
CVK主机失联:当Host主机状态异常、网络中断或服务停止时,CVM无法管理该节点,资源视图会显示异常,该节点上的虚拟机也无法执行迁移。
主机与存储资源问题:这类问题会直接导致虚拟机无法迁移。
主机资源不足:目标主机的CPU或内存不足,或主机处于维护模式、电源状态异常,都会导致迁移任务无法调度。
存储路径不可用:如果虚拟机使用本地硬盘,则不支持在线热迁移。迁移任务要求源端和目标端都能正常访问共享存储。
存储空间不足:在线迁移会产生临时快照,若源端或目标端存储空间不足,迁移就会失败。
按照从简到繁、由外而内的顺序,可参考以下步骤进行排查和修复:
此步骤适用于单个或部分用户报告资源不可见的情况。
检查账户授权:使用系统管理员账户登录,检查问题账户是否在“云资源”中获得了资源授权(注意,“操作权限”和“资源授权”是独立的两个配置)。
检查资源状态:在CAS管理平台,进入“云资源”页面,确认“主机池”、“集群”和“主机”的状态是否正常。
如果多个用户或所有资源都显示异常,则应重点排查CVM服务。
重启CVM相关服务:通过SSH登录CVM节点,尝试重启核心服务并观察日志。
执行 service tomcat8 restart 重启Web服务。
执行 service casserver restart 重启CAS主服务。
若以上步骤无效,可尝试执行 reboot 安全重启整个CVM节点。
检查关键日志:登录CVM节点后台,查看迁移相关的日志获取详细报错。
CAS主日志:查看 /var/log/tomcat/cas.log。
迁移相关日志:查看 /var/log/caslog/backup-restore/cas_br.log 或 /var/log/br_shell_*.log。
检查CVK节点状态:登录到问题主机后台,执行 service libvirtd status 确保虚拟化服务运行正常。
针对明确提示迁移失败或“主机XXX当前状态下不允许执行此操作”的情况。
检查虚拟机状态:执行 virsh list --all 确认虚拟机状态,并检查目标主机是否有足够的CPU和内存资源。
检查存储配置:
本地存储限制:如果虚拟机使用本地存储,则只能进行“更改主机”的离线(关机)迁移。只有配置了共享存储(如IP SAN、FC SAN)才支持在线(热)迁移。
存储空间检查:在线迁移会产生临时快照,需确保源端和目标端存储池有足够可用空间。如空间不足,清理后重试。
尝试关机迁移:如果条件允许,关机后执行离线迁移,以排除业务干扰或在线迁移限制。
如果以上步骤仍无法解决,可考虑以下可能性:
CAS已知Bug:部分E07XX版本的CAS可能存在虚拟机关联资源未正确释放的Bug,导致迁移失败。建议将CAS平台升级至厂商推荐的最新稳定版本。
寻求原厂支持:如果问题依旧,建议联系H3C技术支持热线(400-810-0504),并提供-11等关键日志路径中的具体报错信息。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论