客户有套超融合,有四台主机节点组成的,现在把一台主机需要下电扩完硬件后再启动。现在已经把这台主机上的虚拟机迁移走,后面下电流程怎么做,是否可以在超融合平台前台web页面操作。我现在了解的是把主机进入维护模式,点击更多操作 选关闭主机。这样是不是对的呢 还有需要补充的与注意的地方。
客户有套超融合,有四台主机节点组成的,现在把一台主机需要下电扩完硬件后再启动。现在已经把这台主机上的虚拟机迁移走,后面下电流程怎么做,是否可以在超融合平台前台web页面操作。我现在了解的是把主机进入维护模式,点击更多操作 选关闭主机。这样是不是对的呢 还有需要补充的与注意的地方。
https://www.h3c.com/cn/pub/Document_Center/2023/02/WebHelp_H3C_UISCRH_YHZN/host/maintainModeMgmt.html
标准操作流程
前置检查与准备:在操作前,请登录超融合管理平台,确认目标主机上的业务虚拟机已全部迁移至集群内其他主机,且迁移任务已完成。同时,检查集群中无其他正在运行的任务(如备份、扩容等),并确保目标主机及其所在集群的健康状态显示正常(通常要求健康度为100%)。
将主机置于维护模式:在管理平台的“主机”页面中,选中需要下电的目标主机。通过主机卡片或概要信息页面的“更多操作”菜单,选择“进入维护模式”或类似选项。此操作会通知集群该主机将暂时脱离服务,系统会完成最后的资源协调。
执行关机操作:主机成功进入维护模式后,其状态通常会变更为“维护中”。此时,在相同操作菜单中,“关闭主机”或“关闭电源”选项将变为可用。请通过该选项在Web界面发起软关机指令。严禁在未执行上述步骤的情况下,直接操作服务器的物理电源按钮或拔插电源线进行关机。
硬件维护与上电恢复:待主机完全下电后,即可进行硬件扩容等物理操作。维护完成后,为服务器上电启动。主机启动并完成自检后,超融合平台应能自动重新发现并连接该主机。
退出维护模式:主机恢复正常在线状态后,需在管理平台中手动将其“退出维护模式”。退出后,集群将自动识别主机已回归,并可正常接收业务负载。
关键注意事项
你了解的流程很接近了,但“关闭主机”前有两个极易被忽略的确认步骤,直接关系到集群的稳定性。
简单来说,H3C UIS 官方的操作要求是:进入维护模式时必须勾选“关闭数据平衡”,并且必须在“主机健康度100%”时才能执行关闭操作。
在 Web 界面操作“关闭主机”按钮之前,请务必确认:
集群健康度检查:进入“主机”页面,确保待操作主机的健康度为100%。
Ceph存储状态检查:通过 SSH 登录任意 CVM 节点,执行 ceph -s 命令,确认集群状态为 HEALTH_OK。
您的操作流程在顺序上需要微调,
进入维护模式(关键步骤):在 UIS Web 界面“主机”页面,选择目标主机,进入“维护模式”。必须勾选“关闭数据平衡”选项,以防止下电时因数据重均衡而大量占用网络和磁盘资源。
暂停共享存储并检查:在“存储”管理页面,找到该主机提供的共享存储并暂停。暂停后,再次运行 ceph -s 确认集群健康度未受影响。
通过 Web 界面关闭主机:操作路径是 “主机” > 主机卡片上的“关闭”按钮,或进入概要页面选择“更多操作” > “关闭主机”。Web 界面会先安全关闭操作系统,最后物理下电。注意:如果 CVM 管理节点部署在该主机上,请先迁移 CVM,且管理节点应是集群中最后关闭的。
进行硬件扩容:确认服务器完全断电(电源指示灯为橙色常亮)后,方可进行物理硬件操作。扩容操作务必由硬件工程师参照官方指导进行。
服务器上电:硬件扩容完成后,检查部件安装牢固,然后接通电源并启动服务器。
恢复集群服务:服务器启动并重新加入集群后,在 Web 界面找到该主机,点击“退出维护模式”。随后恢复之前暂停的共享存储。
最终验证:再次确认主机健康度恢复 100%,ceph -s 输出为 HEALTH_OK。如果有虚拟机迁移到其他主机,可在此步骤将它们迁移回来。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论