问

超融合。还原管理平台后，虚拟机报HA异常

UIS超融合

2026-04-14提问

0关注
0收藏，313浏览

zhiliao_8OFGKB

zhiliao_8OFGKB 零段

粉丝：0人关注：1人

问题描述：

三台物理机（主备仲裁）油数据备份文件还原管理平台后，虚拟机报ha异常。同时管理平台监控报ha没开启。实际上已开启

3 个回答

按时间按赞数

刘浩存

刘浩存九段

粉丝：17人关注：1人

这个现象本质上是管理平台自身配置与底层 HA 集群组件状态不一致导致的。简单的说，就是管理平台显示的开关状态，和后台实际的集群状态不同步了。根本原因在于，恢复操作只还原了数据库层面的信息，但未能将 HA 集群中三台物理机的底层配置恢复到一致状态。

解决方案一：尝试平台内操作刷新状态

最简单的方法，尝试通过重新开关 HA 功能，来强制管理平台刷新状态并同步配置。

登录 H3C CAS/UIS 管理平台。
进入集群的 HA 设置界面。
先关闭高可靠性功能，等待几分钟确保操作完成。
再重新开启高可靠性功能。这一步会强制平台重新下发配置，并重新建立主备和仲裁节点之间的心跳连接。

如果界面操作没有反应，可以尝试在后台重启HA服务：

CVM主机的HA服务：service cvm_ha restart
CVK主机的HA服务：service cvk_ha restart

如果上述操作无效，可以检查并确认HA配置文件中主机的勾选状态，有时通过界面取消并重新勾选主机即可修复。

🔧 解决方案二：检查集群配置一致性

如果重启服务无效，说明问题更复杂一些。可能是集群内各节点关于 HA 的配置出现了分歧，可以尝试手动同步配置。

在管理平台导航到“系统管理 > 高可靠性 > 集群状态”。
点击 <手工一致性检查> 按钮，系统会检查主从管理设备的配置是否一致。
若检查发现不一致，点击 <手工同步配置信息> 按钮，将主管理节点的配置同步到所有从节点。

🛠️ 解决方案三：检查底层 HA 组件

如果以上方法无效，大概率是底层 HA 组件本身出了问题。

检查CVM与CVK通信：在 CVM 主机上，检查是否能与 CVK 节点的 HA 相关端口（如 9120）正常通信。
清理HA残留文件：HA 进程可能会在 /var/run/casha/ 目录下留下冻结标记或残留文件。可以进入该目录，确认并谨慎删除可疑的残留文件。注意，此操作建议在关闭集群 HA 后进行。
检查虚拟机XML同步：登录 CVM 主机，检查 HA 目录（如 /etc/cvm/ha/<集群ID>/<CVK主机名>/）下，是否存在对应虚拟机的 XML 配置文件。如果缺失，可以从正常的 CVK 节点拷贝一份过去。

暂无评论

zhiliao_8OFGKB

zhiliao_8OFGKB 知了小白

粉丝：0人关注：1人

大神威武。按第一步等了五分钟。再开ha就好了。感谢🙏

暂无评论

zhiliao_GeOM0O

zhiliao_GeOM0O 八段

粉丝：10人关注：2人

你这个问题是 UIS 超融合还原管理平台后，虚拟机 HA 状态异常、平台显示 “HA 没开启” 但实际已开启的典型场景，根因集中在集群状态、仲裁、HA 服务、元数据不同步这几块。下面给你一套可直接落地、按顺序执行的排障与恢复方案（三节点：主 + 备 + 仲裁）。
一、先明确：为什么还原后会出 HA 异常？
核心原因：
管理平台数据库（配置）与底层集群（corosync/pacemaker/ONEStor）状态不一致
集群心跳、仲裁、节点成员关系被重置 / 丢失
HA 服务、集群锁、存储元数据未重新关联
虚拟机 HA 标记、集群 HA 全局开关在数据库里被 “置为未开启”
表现：
Web 界面：集群 HA 显示 “未开启”
虚拟机：HA 异常、无法故障迁移、告警
底层：节点在线、存储正常，但集群服务未正常选举 / 组建
二、第一步：快速检查（5 分钟定位）
1. Web 界面必查项
集群 → 高可用：
全局 HA 开关是否真为开启
生效最小节点数：三节点建议设为 2（避免单节点就触发 HA 失效）
仲裁节点状态：是否在线、正常
物理主机：
主、备、仲裁全部 Online
无故障、离线、初始化中
虚拟机：
单个虚拟机编辑 → 故障迁移（HA）是否勾选
存储位置必须是虚拟存储（ONEStor），本地盘不支持 HA
2. 后台 CLI 必查（SSH 到管理节点 / CVM）
bash
运行
# 1. 集群服务状态（corosync + pacemaker）
systemctl status corosync pacemaker pcsd
# 必须全是 active (running)

# 2. 查看集群节点成员
crm_mon -A1
# 输出必须包含 3 个节点（主、备、仲裁），全部 Online

# 3. 查看集群资源/锁
pcs status
# 无 Failed 资源，无 Stopped

# 4. 存储状态（ONEStor正常）
storagectl pool list
storagectl pool show --name default
# 健康状态：healthy，副本正常
三、第二步：标准修复流程（按顺序执行，100% 覆盖）
方案 A：快速重建 HA 状态（最常用、优先）
适用：节点在线、存储正常、只是 HA 状态不同步
关闭集群 HA（Web）
集群 → 高可用 → 取消启用 HA → 保存
等待 1 分钟
重新启用集群 HA
勾选启用 HA
生效最小节点数：2
确认仲裁节点正确
保存 → 等待 2～3 分钟（集群重新组建、下发规则）
批量重置虚拟机 HA 标记
全选所有报 HA 异常的虚拟机
更多操作 → 禁用故障迁移
再全选 → 启用故障迁移
强制刷新数据库与底层同步
重启集群相关服务（后台）
bash
运行
# 主/备节点分别执行
systemctl restart corosync pacemaker
# 等待集群重新选举
方案 B：仲裁节点异常修复（三节点必做）
现象：仲裁离线 / 异常 → 集群脑裂 / 锁 → HA 失效
检查仲裁状态（Web → 集群 → 高可用）
若显示异常 / 离线
重建仲裁（后台）
bash
运行
# 1. 移除旧仲裁（仅状态异常时）
pcs cluster remove-arbiter
# 2. 重新添加仲裁（替换为正确仲裁IP）
pcs cluster add-arbitor <仲裁节点IP>
# 3. 查看仲裁状态
crm_mon -A1 | grep -i arbiter
# 必须显示 active
Web 再次开关 HA（同方案 A 步骤 1-2）
方案 C：管理平台还原后 “强制重建集群关系”（彻底修复）
适用：还原后数据库完全错乱、节点虽在线但集群不认
在 Web 中 “重新连接” 所有节点
物理主机 → 选中主 / 备 / 仲裁 → 重新连接
等待全部变为 Online
清空并重建集群配置（后台谨慎执行）
bash
运行
# 仅管理节点执行
uisctl cluster reset
# 提示确认：y
# 会重置集群关系、HA状态、仲裁，不会删数据/虚拟机
重新配置 HA（Web）
启用 HA
最小节点数 2
绑定仲裁
保存
重启所有节点集群服务
bash
运行
# 主、备、仲裁都执行
systemctl restart corosync pacemaker
方案 D：虚拟机仍报 HA 异常（单 VM 修复）
bash
运行
# 1. 对异常虚拟机执行“迁移/疏散”（临时迁出）
# 2. 迁移回来
# 3. 或后台强制刷新 VM HA 状态
virsh update-device <VM名> /etc/libvirt/qemu/<VM名>.xml --force
四、第三步：验证是否恢复
Web：
集群 HA：已启用、正常
虚拟机：无 HA 异常告警
高可用记录：无失败
后台：
bash
运行
crm_mon -A1
# 3节点 Online，仲裁正常
pcs status
# 全正常
测试：
可手动迁移一台虚拟机验证正常
五、常见坑（你大概率中其中一条）
还原后最小节点数还是 3
→ 三节点只要一个不稳就判 HA 失效 → 必须改 2
仲裁节点网络 / 状态异常
→ 三节点集群仲裁一坏，HA 直接不可用
管理平台还原时丢失了集群锁 / 成员关系
→ 必须重建集群 / 重新连接节点
虚拟机用了本地存储
→ 不支持 HA → 必须放 ONEStor 虚拟存储
六、最终建议（最快救急）
先做方案 A（开关 HA + 重置虚拟机 HA）
不行 → 查仲裁 → 方案 B
仍不行 → 方案 C（重置集群关系）

暂无评论

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

超融合。还原管理平台后，虚拟机报HA异常

问题描述：

解决方案一：尝试平台内操作刷新状态

🔧 解决方案二：检查集群配置一致性

🛠️ 解决方案三：检查底层 HA 组件

编辑答案

提出建议