• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

H3C 超融合UIS 6节点如何进行内存和硬盘扩容

2天前提问
  • 0关注
  • 1收藏,82浏览
粉丝:0人 关注:0人

问题描述:

我有6台2u物理服务器组成的超融合集群,现在内存和容量已经不够了,需要在现有基础上进行内存和硬盘扩容,现在每节点服务器都有空余的内存槽位和物理硬盘槽位,足够本次扩容的,这边计划的是每台服务器扩展8条32G DDR4内存和2块960G SSD+2块10T SATA硬盘。问题1、想问一下进行扩容的官方最佳实践是怎样操作,尽量业务不停,我们计划的是首先将其中一台的虚拟机全部迁移至其他主机,然后直接关机,插入内存和新硬盘,开机,然后正常后再搞其他服务器,这个是否正确,中间需要哪些事情呢?问题2、6台服务器如果全部硬盘都检测到之后,接下来就有两种选择了,一种是加入现有存储资源池,一种是新建一个存储资源池,独立于之前的资源池。这两种我们都是可以接收的,官方建议哪一种更平滑和靠谱呢?问题3、整个过程哪些过程是有可能回影响业务的呢?

4 个回答
粉丝:12人 关注:2人

一、问题 1:单节点逐台扩容(迁虚机→关机→加内存硬盘→开机)是否正确?要做哪些事?

结论:思路正确,是官方推荐的在线扩容方式;但必须配合 “先停数据平衡→维护模式→下电→硬件扩容→上电→恢复平衡”,否则会引发大量数据重平衡、影响业务、甚至触发告警H3C。

官方标准步骤(逐台执行,6 台依次来)

1)扩容前检查(所有节点)

  • 集群健康:无故障节点、无告警、三副本完整
  • 版本一致:UIS 平台、分布式存储版本统一
  • 硬件兼容:内存(同代、同电压、同 Rank)、硬盘(SSD/SATA 型号 / 固件一致)

2)单节点进入维护(关键,避免数据重构)

在 UIS Manager:
  • 集群→节点→选中要扩容的主机→进入维护模式
  • 存储→分布式存储→关闭该节点的数据平衡(防止下电时集群认为节点故障而重构数据)H3C

3)迁移所有虚拟机

  • 将该节点上所有 VM热迁移到其他 5 台(6 节点 N+1 冗余,足够)
  • 确认 VM 全部迁移完成、业务正常

4)关机、加硬件

  • 正常下电(不要硬断电)
  • 插 8 条 32G DDR4 内存、2 块 960G SSD、2 块 10T SATA
  • 开机,进 BIOS 确认内存全部识别、硬盘无报错

5)开机后恢复

  • 等待主机重新纳入集群、管理 / 存储网正常
  • 退出维护模式
  • 开启数据平衡(仅本节点,避免全网冲击)
  • 确认存储池状态正常、无告警

6)依次对剩下 5 台重复 2–5 步骤

必须做的关键动作(你容易漏的)

  • ✅ 先关数据平衡再下电(否则集群会疯狂重构)
  • ✅ 必须走维护模式(标记为计划性维护,不触发故障告警)
  • ✅ 内存尽量同规格同批次(避免 NUMA 不均衡、性能抖动)

二、问题 2:新硬盘加入现有池还是新建池?官方建议?

先明确你新增的介质:

  • 每节点:2×960G SSD(性能盘) + 2×10T SATA(容量盘)
  • 原池大概率是:SAS/SATA HDD 或 混合(SSD 缓存 + HDD 容量)

官方原则(非常关键)

  1. 同类型、同规格硬盘才能进同一存储池
  2. SSD 和 SATA HDD 严禁混在一个池(性能、可靠性、分层策略都会乱)
  3. 6 节点全加相同盘,推荐:SSD 建独立高性能池,SATA 建独立大容量池不建议直接混入原池

两种方案对比(结合你的场景)

方案 A:加入现有存储池(不推荐,除非原池就是同规格 SSD/SATA)

  • 优点:统一池化、管理简单
  • 致命问题:
    • 原池若为 HDD:SSD 会被拖慢,无法发挥性能
    • 原池若有 SSD 缓存:新增 SSD 无法作为缓存,只能当容量盘
    • SATA HDD 混入原池(如 SAS):性能不一致、数据分布不均、重构风险高

方案 B:新建两个独立池(官方推荐,平滑 + 靠谱

  • SSD 池(高性能):6 节点 ×2×960G SSD → 全闪池,放数据库、核心业务
  • SATA 池(大容量):6 节点 ×2×10T SATA → 归档、备份、冷数据
  • 优点:
    • 性能隔离:核心业务不被大容量盘拖累
    • 风险隔离:某池故障不影响另一池
    • 符合 UIS 硬盘池设计规范(最多支持 5 个池)H3C
    • 后续可灵活分层、单独扩容

最终建议

直接新建两个独立池:SSD_Pool + SATA_Pool;原池保留旧数据,新业务跑新池,最平滑、最安全、官方首选

三、问题 3:哪些步骤会影响业务?(风险点 + 规避)

1)单节点 VM 热迁移(低影响)

  • 影响:VM 短暂卡顿(毫秒–秒级),网络微断
  • 规避:业务低峰期迁移;6 节点冗余,迁移期间集群性能正常

2)节点下电→上电(无影响,前提:维护模式 + 关平衡)

  • 正确操作:维护模式 + 关平衡→下电→上电→恢复
  • 无影响:集群不重构、数据不动、业务无感
  • 错误操作:直接下电→集群判定节点故障→触发全集群数据重构(带宽占满、性能暴跌、持续数小时)H3C

3)全网数据重平衡(高影响,必须避)

  • 场景:6 台全部加完后,一次性开启所有节点平衡
  • 影响:存储网打满、读写延迟飙升、业务卡顿
  • 规避:逐台开启平衡,等一台平衡完再下一台;夜间低峰期做

4)新硬盘加入 / 创建存储池(低影响)

  • 影响:仅初始化(几秒–分钟),无业务中断
  • 规避:单节点操作,不跨节点批量执行

5)内存扩容本身(无影响)

  • 仅开机自检识别,不影响集群和业务

四、整体时序(最稳、影响最小)

  1. 夜间低峰→节点 1:维护→迁 VM→关平衡→下电→加内存硬盘→上电→开平衡→退维护
  2. 等待节点 1 平衡完成(1–2 小时)
  3. 依次对节点 2–6 重复步骤 1–2
  4. 全部完成后→创建 SSD_Pool(6×2 SSD)、SATA_Pool(6×2 SATA)
  5. 新业务部署到新池;旧业务可平滑迁移到 SSD 池提速

五、一句话总结

  • 问题 1:逐台迁虚机 + 维护模式 + 关平衡 + 硬件扩容,正确且安全;
  • 问题 2:新建 SSD 高性能池 + SATA 大容量池,官方推荐、最平滑;
  • 问题 3:错误下电引发全网重构风险最大;严格按维护流程操作,业务基本无感知。

粉丝:10人 关注:9人

问题1:你的计划核心正确,但需优化:先确认集群无告警,通过UIS平台将目标节点进入维护模式(自动迁移所有VM,比手动迁移更稳妥),而非手动迁完关机;内存需同规格(DDR4频率、容量一致,品牌尽量匹配),硬盘需与现有存储池硬盘类型兼容(如现有SSD为缓存层,新SSD选同类型),插完开机后退出维护模式,等待集群同步。
问题2:官方建议加入现有存储资源池,新建会割裂资源、增加管理复杂度,现有池扩容时UIS分布式存储会自动将新硬盘纳入,完成数据均衡,业务无感知,更平滑。
问题3:影响业务的环节:① 目标节点迁移VM时,若其他节点资源不足,迁移失败会导致无法进入维护模式,强制关机影响业务;② 集群HA配置不当,节点维护时触发不必要的HA重启;③ 硬盘扩容后的数据均衡阶段,高IO业务可能有短暂性能下降;④ 硬件兼容性问题导致节点异常,影响集群可用性。

粉丝:17人 关注:1人

问题1:扩容操作的最佳实践流程

你的计划(迁移虚拟机 -> 关机 -> 插硬件 -> 开机)大体正确,但为了确保超融合分布式存储的数据安全,在关机和进入维护模式前后,必须加入关键的“存储保护”步骤


问题2:存储资源池的选择建议

官方强烈建议新建一个独立的存储资源池
虽然加入现有池看起来管理更方便,但你的扩容方案存在以下两个硬性冲突,导致无法直接加入原池:
  1. 缓存盘容量不一致:你计划新增 960G SSD 作为缓存盘,而原集群的缓存盘大概率不是这个容量。UIS 分布式存储要求同一存储池内的缓存盘容量必须完全一致,否则会按最小盘容量计算,造成严重的空间浪费和性能短板。
  2. 硬盘介质混用风险:如果你的原集群是全闪存(全SSD)池,绝对禁止将 10T 的机械硬盘(HDD)加入其中。不同介质类型(SSD 和 HDD)混用会导致整个存储池的性能急剧下降至机械硬盘的水平。
最佳实践:在 UIS 平台上新建一个专门由这 6 台服务器的新硬盘组成的“高性能/大容量存储池”。新建虚拟机时,根据业务需求选择将磁盘放在老池还是新池,互不影响,最为平滑靠谱。


 问题3:可能影响业务的风险点

整个滚动扩容过程中,以下几个环节可能会对业务产生感知或潜在风险:
  1. 集群数据重新平衡(最主要的影响):每当一个节点退出维护模式重新上线,或者新硬盘加入存储池后,集群会自动触发数据的重新平衡(Rebalance)。这个过程会大量占用存储网络和磁盘 I/O,会导致集群整体性能短暂下降
  2. 剩余节点的负载压力:在单台节点关机维护期间,该节点承载的所有虚拟机业务都转移到了其余 5 台节点上。需要确保剩余节点的 CPU 和内存资源足够承载这些额外负载,否则可能出现资源争抢。
  3. 新硬件的兼容性:虽然你计划购买 DDR4 内存,但务必确保新内存的频率、Rank(如2Rx4)、容量与原内存完全一致,否则可能导致服务器无法开机或运行不稳定。硬盘方面,新加的硬盘必须先在服务器 RAID 卡中配置为 HBA(直通)或 JBOD 模式,绝对不能做 RAID,否则 UIS 无法识别和管理。

SSD做缓存跟HDD 的机械硬盘不就是超融合存储的优势吗 我意思是我就是准备混合用的呀 之前的虚拟存储池也是SSD+HDD混合使用的呀 你的意思是SSD 建一个存储池,HDD 建一个存储池吗

zhiliao_N5Mm6S 发表时间:1天前 更多>>

SSD做缓存跟HDD 的机械硬盘不就是超融合存储的优势吗 我意思是我就是准备混合用的呀 之前的虚拟存储池也是SSD+HDD混合使用的呀 你的意思是SSD 建一个存储池,HDD 建一个存储池吗

zhiliao_N5Mm6S 发表时间:1天前
粉丝:2人 关注:0人

你先把当前服务器配置发一下,尤其是是硬盘背板型号,

1,待升级主机迁移虚拟机到其他节点,然后暂停本节点的所有共享存储,

2,关机下架,下架前拍照记录连线顺序

3,插入匹配内存,插入硬盘,上架开机,

4,检查HDM带外内存上线情况,如果是LSI阵列卡可以在HDM页面创建阵列,其他型号阵列卡去BIOS里面进入阵列卡菜单创建阵列

5,当前节点数据盘要是直通模式,新增硬盘就用直通,要是单盘RAID0模式就根据情况新曾硬盘,逐一单盘创建RAID0,然开保存退出开机正常进入系统

6,进入系统后ssh登录主机后台ceph -s 观察存储均衡状态, 一定要等到 health: HEALTH_OK显示ok,前台web页面onestor存储页面存储集群健康度100%在进行第二台的操作.

7,操作步骤如上,所有节点都操作完毕后内存扩容全部上线, 存储池只能扩容同规格的数据盘 无法扩容缓存盘 单独创建存储池看规划,2块960G SSD+2块10T SATA硬盘 可以做闪存加速硬盘池

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明