问题处理步骤
1. 避免HDM直接重启主机
在主机(如cvknode2)的HDM界面强制重启存在风险:
存储服务中断:超融合架构中主机承载分布式存储服务,强制重启可能导致存储心跳丢失、节点离线告警甚至数据访问异常。
集群状态混乱:可能导致集群分裂(Splitbrain)问题,需人工介入修复。
2. 优先通过管理平台操作
登录cvknode3的UIS管理界面(因其他节点异常,需通过正常节点操作)。
对异常主机(cvknode1/cvknode2)右键选择 "修改主机" → 重新设置root密码 → "连接主机"。
说明:后台修改主机密码会导致管理平台凭证失效,此操作可同步密码并重建连接。
3. 强制重启场景(谨慎操作)
若上述无效且必须重启:
前置检查:
确认所有虚拟机已迁移至cvknode3(避免业务中断)。
检查存储健康状态:登录UIS管理平台 → 存储 → 分布式存储 → 确保无"降级"告警。
重启流程:
markdown
1. 通过cvknode3管理界面将目标主机(如cvknode2)置为"维护模式"(停用存储服务)。
2. 进入cvknode2的HDM控制台 → 安全重启主机(非强制下电)。
3. 重启后于UIS平台检查主机状态,若仍异常则重做"连接主机"操作。
4. 恢复管理服务(cvknode1失效时)
UIS管理平台默认部署在首个初始化节点(cvknode1)。
临时方案:通过cvknode3临时访问,但需修复cvknode1:
markdown
进入cvknode1后台检查关键服务:
systemctl status uiscore.service 管理平台核心服务
systemctl status storageagent.service 存储代理服务
尝试重启服务:systemctl restart uiscore storageagent
关键风险提示
禁止跳过维护模式直接重启:可触发存储保护锁(IO暂停),需技术支持解锁。
多节点异常时勿批量操作:优先修复一个节点(如cvknode2),恢复后再处理cvknode1。
若以上步骤无效:
收集所有节点日志(路径:/var/log/uiscore/ 及 /var/log/storage/)并联系4008100504技术支持,避免进一步操作导致故障扩散。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论