给华三UIS集群(4节点)扩容内存,无法在线操作,需要逐个节点关机处理。核心流程是:迁移虚拟机、暂停共享存储、进入维护模式、关机插内存、检查识别、退出维护模式,再继续操作下一个节点。
下面是详细的操作过程,操作前建议先做好数据备份和检查工作。
确认授权:纯计算虚拟化(CVK)节点扩容内存一般不需要额外的授权(License)。但如果扩容的是云虚拟化管理平台(CVM)节点,可能需要更新授权,操作前务必确认清楚。
检查兼容性:确保新内存条与原有内存在型号、容量、速率、Rank(如2Rx4)上完全一致,以避免兼容性问题。根据H3C UIS 3000 G5型号的示例,服务器内存槽位有白、黑两种颜色,安装时需要按顺序优先插满白色的DIMM插槽。
规划顺序:因为是4个节点,建议规划好逐个操作的顺序。特别是,如果某个节点是管理节点,它也可以按照此流程操作,进入维护模式后管理界面依然可以访问。
备份数据:强烈建议在执行任何硬件变更前,对重要数据进行备份,并建议在业务低峰期进行操作。
以单个节点为例,完整流程如下:
第一步:迁移虚拟机(节点上的所有业务虚机)
第二步:暂停共享存储池
第三步:进入维护模式
第四步:关机并添加物理内存
第五步:开机并退出维护模式
第六步:验证并恢复
完成一个节点的验证后,再对下一个节点重复以上步骤。
| 步骤 | 核心操作 | 注意事项(版本/场景差异) |
|---|---|---|
| 1. 迁移虚拟机 | 在线迁移所有业务虚机 | 确保目标节点资源充足 |
| 2. 暂停共享存储 | 在“存储”页签,暂停“共享文件系统”类型存储池 | - |
| 3. 进入维护模式 | 点击“进入维护模式”按钮 | E0709及之后:勾选“关闭数据平衡” E0709之前:还需执行 ceph osd set noout/noup命令 |
| 4. 关机 & 硬件扩容 | 远程或手动关机,插入内存条 | 务必断电操作,内存安装需对称、型号一致 |
| 5. 开机 & 退出维护 | 开机,刷新识别,退出维护模式 | 退出后,E0709之前版本需执行ceph osd unset noout/unup |
| 6. 验证恢复 | 检查集群状态与资源平衡 | 可手动或让DRS自动处理业务虚机回迁 |
内存条插错位置:务必查阅对应服务器型号的用户手册。正确的插法通常遵循特定顺序(如“先白后黑”),不按照规范插内存可能导致服务器无法启动或无法识别全部容量。
忘记暂停共享存储或进入维护模式:如果在不停止数据服务的情况下直接关机,可能引发数据不一致或集群故障。
新旧内存不兼容:不同型号、频率或厂商的内存混插是最常见的不稳定因素之一。
操作完成后忘记退出维护模式:节点将长期不接受新虚拟机调度,且对于旧版本,忘记执行 ceph osd unset 命令会导致集群数据不均衡且不进行恢复,有数据丢失风险。
授权问题:如果扩容后内存未能识别,建议检查是否因内存插槽问题或系统版本限制,并确认是否涉及CVM节点的Licence变更。
按照这个流程来操作,风险一般是可控的。如果对硬件操作不太熟悉,建议联系厂商(如有维保可拨打400热线)或专业的IT人员来现场指导。
为了给4个节点增加内存,最稳妥的操作是逐个节点有序执行,每一轮都要完成“迁移业务 -> 暂停存储 -> 维护模式 -> 关机 -> 物理更换 -> 开机 -> 检查验证”这一标准流程。
为了帮你更清晰地理解和执行,我将整个操作过程拆解为三个核心阶段:
节点角色确认:登录UIS管理平台,确认这4个节点的角色。若为CVM节点(云虚拟化管理节点),其授权(License)可能与硬件绑定。扩容后,需检查授权状态是否依然有效。
备份数据:在执行任何变更前,务必对平台和所有关键虚拟机(VM)进行一次完整的备份,这是最重要的安全保障。
检查兼容性:新购内存必须与原内存的型号、容量、速率和Rank(例如2Rx4)完全一致,以避免系统不稳定或无法识别
准备硬件资料:提前找好服务器的硬件用户手册,重点关注内存插槽的安装顺序和规则。
规划操作顺序:在业务低峰期操作,并规划好4个节点的处理顺序。
确认准备就绪后,就可以开始按顺序、一次只处理一个节点,重复以下四个关键步骤:
疏散业务与暂停存储
迁出所有虚拟机:在UIS平台将该节点上的所有虚拟机在线迁移(LIVE Migration)至集群内其他资源充足的节点。
暂停存储池(集群版本小于E0709):针对旧版本(E0709),在迁移虚机后,根据文档进入“主机的存储池列表页面”,暂停类型为“共享文件系统”的存储池。
开启节点维护模式(核心)
在主机列表中找到目标节点,进入主机概要页面,点击 “进入维护模式”
重要提示:
E0709及之后版本:在弹出的窗口中勾选 “关闭数据平衡”。
E0709之前版本:进入维护模式后,还需通过SSH登录集群后台,执行 ceph osd set noout 和 ceph osd set noup 命令来停止数据迁移。
硬件更换与主机重启
物理更换:通过HDM或iLO等远程管理工具将主机完全关机。确保主机断电后,安装好新的内存条。注意:UIS一体机的内存不支持热插拔,必须断电操作。
开机检查:打开主机电源,等待操作系统完全启动。
退出维护并验证
恢复服务:节点启动后,回到UIS平台找到该节点,点击 “退出维护模式”
验证扩容:在UIS管理平台顶部主机列表中,找到已完成扩容的主机,单击该行“操作”列的 “刷新” 按钮,检查“内存容量”数值是否已更新。
恢复存储(集群版本小于E0709):针对旧版本(E0709),在退出维护模式后,返回“主机的存储池列表页面”,将类型为“共享文件系统”的存储池恢复运行。
完成所有节点的逐个操作后,进行最终的整体检查。
License核查:若包含CVM节点且扩容后授权异常,请立即联系H3C技术支持更新License。
功能验证:在UIS平台确认所有节点状态正常,尝试启动任意虚拟机,并验证业务是否可以正常访问。
资源监测:在接下来的一段时间内,持续监控集群的CPU、内存及数据盘的使用情况,观察是否存在因负载不均而自动触发的虚拟机迁移。
务必逐节点操作:在一个节点完全验证成功,并确认集群状态恢复“健康”后,再开始操作下一个节点。
确保业务连续性:迁移虚拟机前,务必确认目标节点有足够的CPU和内存资源。同时,请确保集群已开启并配置好DRS(动态资源调度)功能,这能保障在节点进入维护模式后,其上的虚拟机被自动迁移。
正确安装内存:务必按照硬件手册的规则安装。插错位置是导致扩容失败最常见的原因
旧版本集群特别注意:若您的UIS版本低于E0709,在步骤2和4中关于设置/取消 noout 和 noup 的SSH命令操作至关重要,务必执行,否则可能导致集群异常。
暂无评论
你们是 4 节点 UIS 集群,给每个节点加内存,标准做法是:逐个节点滚动扩容(不中断业务)→ 迁虚拟机→进维护模式→关机→加内存→开机→退出维护模式→下一个节点。下面给你一套可直接照着做的完整流程。
0. 扩容前准备(必做)
集群状态健康
UIS Manager:所有主机 “正常”,存储池健康,无告警。
后台任意节点执行:
bash
运行
ceph -s
保证 HEALTH_OK 或仅少量无关告警。
内存兼容性
新内存:同代(DDR4/DDR5)、同规格(LRDIMM/RDIMM)、同电压、同频率,容量可不同但建议一致。
插槽:按服务器内存布线规则(CPU0/CPU1 交错),UIS 机型一般在机箱盖内侧有图。
资源检查
剩余 3 台节点的内存 + CPU 足够承载当前所有虚拟机(不然迁不完)。
1. 单个节点扩容步骤(4 台都按这一套来)
1)迁移该节点上所有虚拟机(业务不中断)
UIS Manager → 虚拟机 → 勾选该节点上所有 VM → 迁移 → 更改主机 → 选其他正常节点 → 开始迁移。
迁移超时建议设为 0,避免中途暂停。
2)暂停该节点的共享存储池
主机 → 目标主机 → 存储 → 共享文件系统 / 块存储池 → 全部 “暂停”。
3)进入维护模式(关键,防止数据重平衡)
UIS Manager → 主机 → 目标主机 → 进入维护模式(勾选 “自动迁移” 之类,此时已无 VM)。
后台加固(防止数据迁移):
bash
运行
ceph osd set noout
ceph osd set noup
执行后 ceph -s 会显示 noout、noup,健康状态变为 WARN,正常。
4)关机、加内存
UIS Manager 对该主机执行 “关机”,等待完全下电。
物理机:
戴防静电腕带 / 防静电手套、接地。
开盖,按标签 / 说明书插新内存,注意插槽顺序(双 CPU 一般 0/1/2/3 交错)。
盖好机箱。
5)开机、识别内存
物理开机,等待 UIS Manager 自动纳管(约 3–5 分钟)。
UIS → 主机 → 该主机 → 刷新,确认总内存已变大。
6)退出维护模式、恢复存储
UIS → 主机 → 退出维护模式。
后台解除保护:
bash
运行
ceph osd unset noout
ceph osd unset noup
观察 ceph -s,集群重新恢复 HEALTH_OK。
7)验证
虚拟机可迁回(可选),业务正常,无存储告警。
2. 4 节点整体顺序
按 节点 1 → 节点 2 → 节点 3 → 节点 4 的顺序,一次只动一台,每台都走完上面 7 步再下一台。
3. 常见坑 & 避坑
❌ 不进维护模式直接关机:会触发 Ceph 数据重平衡,4 节点压力大,可能卡慢。
❌ 内存规格不一致:可能降频、不稳定、甚至无法开机。
❌ 一次扩两台:集群同时下线两节点,高可用风险大(4 节点一般允许 1 台故障)。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论