根据H3C CAS维护手册(E0785及之后版本)和应急故障恢复指导(5W107),结合您的场景分析如下:
1. 手动通过XML文件在空闲宿主机拉起虚拟机
可行
若宿主机故障触发HA迁移失败(如目标主机资源不足),您仍可手动将故障主机上的虚拟机XML文件定义到空闲宿主机,并通过virsh define和virsh start命令拉起虚拟机。
操作前提:
目标宿主机必须满足虚拟机的资源需求(CPU、内存、存储空间)。
虚拟机的磁盘文件需位于共享存储(如OCFS2/IP-SAN/FC-SAN),确保目标主机可访问。
操作前必须关闭故障主机上的虚拟机(如强制下电),防止双写冲突。
XML文件获取路径:
集群开启HA时:从CVM主机的HA目录获取(/etc/cvm/ha/cluster_id/cvk_name/虚拟机高级名称.xml)。
未开启HA时:从管理平台备份文件中提取(front/cvks/cvknode1/libvirt/qemu/)。
2. 资源不足对手动操作的影响
⚠️ 手动操作同样受资源限制
若目标宿主机资源不足(如空闲内存不足),即使手动执行virsh start,虚拟机仍会因资源分配失败无法启动,并报错(如internal error: process exited while connecting to monitor)。
根本原因:
Libvirt在启动虚拟机前会检查主机资源(参考/etc/cvk/cpu_mem_threshold.conf配置),若剩余资源低于阈值,启动将被拒绝。
HA迁移失败的原因(资源不足)同样适用于手动操作,两者依赖相同的资源校验机制。
操作建议与风险规避
1. 资源检查:
执行手动拉起前,通过free -g、top等命令确认目标宿主机剩余内存/CPU是否满足虚拟机需求。
若资源不足:
临时关闭其他非关键虚拟机释放资源。
或扩容目标主机硬件资源(如增加内存)。
2. 关键步骤:
关闭故障主机虚拟机:通过CVM平台强制关闭或故障主机下电。
修改XML文件:检查XML中磁盘路径、网络配置是否适配目标主机环境。
执行定义与启动:
virsh define /etc/libvirt/qemu/vm-name.xml 定义虚拟机
virsh start vm-name 启动虚拟机
平台同步:
在CVM界面中对目标宿主机执行"连接主机"操作,同步虚拟机状态。
重新绑定网络策略模板(手动操作后策略模板会丢失)。
3. 风险提示:
若故障主机未隔离或虚拟机未关闭,同时运行同名虚拟机将导致磁盘数据损坏。
本地磁盘存储的虚拟机无法通过此方式恢复(需共享存储支持)。
参考文档:
H3C CAS应急故障恢复指导-5W107:单台CVK主机故障的恢复流程。
H3C CAS维护手册-5W113:HA配置检测与XML文件路径说明。
H3C CAS维护手册-5W112:Libvirt资源检查机制(/etc/cvk/cpu_mem_threshold.conf)。
若目标主机资源确无余量,需先释放资源或迁移其他虚拟机,否则手动操作也无法成功启动。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论