• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

uis节点扩容

2天前提问
  • 0关注
  • 0收藏,53浏览
粉丝:0人 关注:0人

问题描述:

有4个节点的超融合UIS。需要给每个节点增加内存。我需要怎么操作?

5 个回答
粉丝:18人 关注:0人

给华三UIS集群(4节点)扩容内存,无法在线操作,需要逐个节点关机处理。核心流程是:迁移虚拟机、暂停共享存储、进入维护模式、关机插内存、检查识别、退出维护模式,再继续操作下一个节点

下面是详细的操作过程,操作前建议先做好数据备份和检查工作。

🛡️ 操作前:准备工作

  1. 确认授权:纯计算虚拟化(CVK)节点扩容内存一般不需要额外的授权(License)。但如果扩容的是云虚拟化管理平台(CVM)节点,可能需要更新授权,操作前务必确认清楚

  2. 检查兼容性:确保新内存条与原有内存在型号、容量、速率、Rank(如2Rx4)上完全一致,以避免兼容性问题。根据H3C UIS 3000 G5型号的示例,服务器内存槽位有白、黑两种颜色,安装时需要按顺序优先插满白色的DIMM插槽。

  3. 规划顺序:因为是4个节点,建议规划好逐个操作的顺序。特别是,如果某个节点是管理节点,它也可以按照此流程操作,进入维护模式后管理界面依然可以访问

  4. 备份数据:强烈建议在执行任何硬件变更前,对重要数据进行备份,并建议在业务低峰期进行操作。

⚙️ 详细操作步骤(按节点逐一操作)

以单个节点为例,完整流程如下:

  1. 第一步:迁移虚拟机(节点上的所有业务虚机)

    • 登录UIS超融合管理平台,选择顶部“虚拟机”页签。

    • 找到位于待扩容节点上的所有虚拟机,将其在线迁移到集群内的其他正常节点上。如果虚拟机配置了本地直通设备等,迁移可能会失败,需要提前检查。

  2. 第二步:暂停共享存储池

    • 在“主机”页签,进入待扩容主机的概要信息页面,切换到“存储”页签。

    • 找到类型为“共享文件系统”的存储池,依次点击操作列的按钮将其暂停

  3. 第三步:进入维护模式

    • 在主机的概要信息页面,点击“进入维护模式”按钮。

    • 注意:根据UIS的不同版本,弹窗中会有不同选项

      • E0709及之后版本:直接勾选“关闭数据平衡”。

      • E0709之前的版本:进入维护模式后,还需额外执行SSH命令开启存储维护模式。登录任意正常节点后台,执行 ceph osd set noout 和 ceph osd set noup 命令来停止数据恢复和回填。完成后,可通过 ceph -s 命令检查集群状态,确保它变为 HEALTH_WARN,并看到 noout,noup flags set 的提示

    • 这一步至关重要,可以防止集群在单个节点下线时触发不必要的数据恢复。

  4. 第四步:关机并添加物理内存

    • 维护模式开启后,通过UIS管理平台或服务器的HDM管理口远程将待扩容的节点正常关机

    • 关机断电后,按照服务器背板图示和内存安装规则,将新内存条插入正确的槽位。

  5. 第五步:开机并退出维护模式

    • 物理内存安装完毕后,将服务器重新开机,等待其自动接入UIS集群。

    • 进入UIS管理平台的“主机”页签,找到该主机,点击“刷新”按钮,确认新增的内存总容量已正确识别

    • 确认无误后,在主机概要信息页面,点击“退出维护模式

    • 注意:如果你在第三步(E0709之前版本)执行了SSH命令开启存储维护模式,务必在主机退出维护模式后,登录同一节点执行 ceph osd unset noout 和 ceph osd unset noup 命令来恢复集群的数据平衡功能。

  6. 第六步:验证并恢复

    • 退出维护模式后,观察集群状态是否恢复正常。待集群完全健康后,可手动将部分虚拟机迁移回此节点,或依赖动态资源调度(DRS)自动进行资源平衡

完成一个节点的验证后,再对下一个节点重复以上步骤。

📋 关键事项速查表

步骤核心操作注意事项(版本/场景差异)
1. 迁移虚拟机在线迁移所有业务虚机确保目标节点资源充足
2. 暂停共享存储在“存储”页签,暂停“共享文件系统”类型存储池-
3. 进入维护模式点击“进入维护模式”按钮E0709及之后:勾选“关闭数据平衡”
E0709之前:还需执行ceph osd set noout/noup命令
4. 关机 & 硬件扩容远程或手动关机,插入内存条务必断电操作,内存安装需对称、型号一致
5. 开机 & 退出维护开机,刷新识别,退出维护模式退出后,E0709之前版本需执行ceph osd unset noout/unup
6. 验证恢复检查集群状态与资源平衡可手动或让DRS自动处理业务虚机回迁

💡 常见问题提示

  • 内存条插错位置:务必查阅对应服务器型号的用户手册。正确的插法通常遵循特定顺序(如“先白后黑”),不按照规范插内存可能导致服务器无法启动或无法识别全部容量。

  • 忘记暂停共享存储或进入维护模式:如果在不停止数据服务的情况下直接关机,可能引发数据不一致或集群故障。

  • 新旧内存不兼容:不同型号、频率或厂商的内存混插是最常见的不稳定因素之一。

  • 操作完成后忘记退出维护模式:节点将长期不接受新虚拟机调度,且对于旧版本,忘记执行 ceph osd unset 命令会导致集群数据不均衡且不进行恢复,有数据丢失风险。

  • 授权问题:如果扩容后内存未能识别,建议检查是否因内存插槽问题或系统版本限制,并确认是否涉及CVM节点的Licence变更。

按照这个流程来操作,风险一般是可控的。如果对硬件操作不太熟悉,建议联系厂商(如有维保可拨打400热线)或专业的IT人员来现场指导。

暂无评论

粉丝:2人 关注:0人

能停业务的话,直接按照uis更换硬件步骤,进维护模式,下电,然后把内存插上,然后开机,退出维护模式。

暂无评论

粉丝:43人 关注:1人

一台一台节点关机扩容内存条,操作完后,集群变成health_ok 再进行下一台

暂无评论

粉丝:16人 关注:1人

为了给4个节点增加内存,最稳妥的操作是逐个节点有序执行,每一轮都要完成“迁移业务 -> 暂停存储 -> 维护模式 -> 关机 -> 物理更换 -> 开机 -> 检查验证”这一标准流程

为了帮你更清晰地理解和执行,我将整个操作过程拆解为三个核心阶段:


 第一阶段:操作前准备

  • 节点角色确认:登录UIS管理平台,确认这4个节点的角色。若为CVM节点(云虚拟化管理节点),其授权(License)可能与硬件绑定。扩容后,需检查授权状态是否依然有效。

  • 备份数据:在执行任何变更前,务必对平台和所有关键虚拟机(VM)进行一次完整的备份,这是最重要的安全保障。

  • 检查兼容性:新购内存必须与原内存的型号、容量、速率和Rank(例如2Rx4)完全一致,以避免系统不稳定或无法识别

  • 准备硬件资料:提前找好服务器的硬件用户手册,重点关注内存插槽的安装顺序和规则

  • 规划操作顺序:在业务低峰期操作,并规划好4个节点的处理顺序。


 第二阶段:关键四步法(单节点)

确认准备就绪后,就可以开始按顺序、一次只处理一个节点,重复以下四个关键步骤:

  1. 疏散业务与暂停存储

    • 迁出所有虚拟机:在UIS平台将该节点上的所有虚拟机在线迁移(LIVE Migration)至集群内其他资源充足的节点。

    • 暂停存储池(集群版本小于E0709):针对旧版本(E0709),在迁移虚机后,根据文档进入“主机的存储池列表页面”,暂停类型为“共享文件系统”的存储池。

  2. 开启节点维护模式(核心)

    • 在主机列表中找到目标节点,进入主机概要页面,点击 “进入维护模式” 

    • 重要提示

      • E0709及之后版本:在弹出的窗口中勾选 “关闭数据平衡”

      • E0709之前版本:进入维护模式后,还需通过SSH登录集群后台,执行 ceph osd set noout 和 ceph osd set noup 命令来停止数据迁移。

  3. 硬件更换与主机重启

    • 物理更换:通过HDM或iLO等远程管理工具将主机完全关机。确保主机断电后,安装好新的内存条。注意:UIS一体机的内存不支持热插拔,必须断电操作。

    • 开机检查:打开主机电源,等待操作系统完全启动。

  4. 退出维护并验证

    • 恢复服务:节点启动后,回到UIS平台找到该节点,点击 “退出维护模式”

    • 验证扩容:在UIS管理平台顶部主机列表中,找到已完成扩容的主机,单击该行“操作”列的 “刷新” 按钮,检查“内存容量”数值是否已更新。

    • 恢复存储(集群版本小于E0709):针对旧版本(E0709),在退出维护模式后,返回“主机的存储池列表页面”,将类型为“共享文件系统”的存储池恢复运行。


 第三阶段:验收与收尾

完成所有节点的逐个操作后,进行最终的整体检查。

  • License核查:若包含CVM节点且扩容后授权异常,请立即联系H3C技术支持更新License。

  • 功能验证:在UIS平台确认所有节点状态正常,尝试启动任意虚拟机,并验证业务是否可以正常访问。

  • 资源监测:在接下来的一段时间内,持续监控集群的CPU、内存及数据盘的使用情况,观察是否存在因负载不均而自动触发的虚拟机迁移。


 扩容关键注意事项

  • 务必逐节点操作:在一个节点完全验证成功,并确认集群状态恢复“健康”后,再开始操作下一个节点。

  • 确保业务连续性:迁移虚拟机前,务必确认目标节点有足够的CPU和内存资源。同时,请确保集群已开启并配置好DRS(动态资源调度)功能,这能保障在节点进入维护模式后,其上的虚拟机被自动迁移。

  • 正确安装内存:务必按照硬件手册的规则安装。插错位置是导致扩容失败最常见的原因

  • 旧版本集群特别注意:若您的UIS版本低于E0709,在步骤2和4中关于设置/取消 noout 和 noup 的SSH命令操作至关重要,务必执行,否则可能导致集群异常。

暂无评论

粉丝:10人 关注:2人

你们是 4 节点 UIS 集群,给每个节点加内存,标准做法是:逐个节点滚动扩容(不中断业务)→ 迁虚拟机→进维护模式→关机→加内存→开机→退出维护模式→下一个节点。下面给你一套可直接照着做的完整流程。
0. 扩容前准备(必做)
集群状态健康
UIS Manager:所有主机 “正常”,存储池健康,无告警。
后台任意节点执行:
bash
运行
ceph -s
保证 HEALTH_OK 或仅少量无关告警。
内存兼容性
新内存:同代(DDR4/DDR5)、同规格(LRDIMM/RDIMM)、同电压、同频率,容量可不同但建议一致。
插槽:按服务器内存布线规则(CPU0/CPU1 交错),UIS 机型一般在机箱盖内侧有图。
资源检查
剩余 3 台节点的内存 + CPU 足够承载当前所有虚拟机(不然迁不完)。
1. 单个节点扩容步骤(4 台都按这一套来)
1)迁移该节点上所有虚拟机(业务不中断)
UIS Manager → 虚拟机 → 勾选该节点上所有 VM → 迁移 → 更改主机 → 选其他正常节点 → 开始迁移。
迁移超时建议设为 0,避免中途暂停。
2)暂停该节点的共享存储池
主机 → 目标主机 → 存储 → 共享文件系统 / 块存储池 → 全部 “暂停”。
3)进入维护模式(关键,防止数据重平衡)
UIS Manager → 主机 → 目标主机 → 进入维护模式(勾选 “自动迁移” 之类,此时已无 VM)。
后台加固(防止数据迁移):
bash
运行
ceph osd set noout
ceph osd set noup
执行后 ceph -s 会显示 noout、noup,健康状态变为 WARN,正常。


4)关机、加内存
UIS Manager 对该主机执行 “关机”,等待完全下电。
物理机:
戴防静电腕带 / 防静电手套、接地。
开盖,按标签 / 说明书插新内存,注意插槽顺序(双 CPU 一般 0/1/2/3 交错)。
盖好机箱。
5)开机、识别内存
物理开机,等待 UIS Manager 自动纳管(约 3–5 分钟)。
UIS → 主机 → 该主机 → 刷新,确认总内存已变大。
6)退出维护模式、恢复存储
UIS → 主机 → 退出维护模式。
后台解除保护:
bash
运行
ceph osd unset noout
ceph osd unset noup
观察 ceph -s,集群重新恢复 HEALTH_OK。
7)验证
虚拟机可迁回(可选),业务正常,无存储告警。
2. 4 节点整体顺序
按 节点 1 → 节点 2 → 节点 3 → 节点 4 的顺序,一次只动一台,每台都走完上面 7 步再下一台。
3. 常见坑 & 避坑
❌ 不进维护模式直接关机:会触发 Ceph 数据重平衡,4 节点压力大,可能卡慢。
❌ 内存规格不一致:可能降频、不稳定、甚至无法开机。
❌ 一次扩两台:集群同时下线两节点,高可用风险大(4 节点一般允许 1 台故障)。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明