一、问题 1:单节点逐台扩容(迁虚机→关机→加内存硬盘→开机)是否正确?要做哪些事?
结论:思路正确,是官方推荐的在线扩容方式;但必须配合 “先停数据平衡→维护模式→下电→硬件扩容→上电→恢复平衡”,否则会引发大量数据重平衡、影响业务、甚至触发告警H3C。
官方标准步骤(逐台执行,6 台依次来)
1)扩容前检查(所有节点)
- 集群健康:无故障节点、无告警、三副本完整
- 版本一致:UIS 平台、分布式存储版本统一
- 硬件兼容:内存(同代、同电压、同 Rank)、硬盘(SSD/SATA 型号 / 固件一致)
2)单节点进入维护(关键,避免数据重构)
- 集群→节点→选中要扩容的主机→进入维护模式
- 存储→分布式存储→关闭该节点的数据平衡(防止下电时集群认为节点故障而重构数据)H3C
3)迁移所有虚拟机
- 将该节点上所有 VM热迁移到其他 5 台(6 节点 N+1 冗余,足够)
- 确认 VM 全部迁移完成、业务正常
4)关机、加硬件
- 正常下电(不要硬断电)
- 插 8 条 32G DDR4 内存、2 块 960G SSD、2 块 10T SATA
- 开机,进 BIOS 确认内存全部识别、硬盘无报错
5)开机后恢复
- 等待主机重新纳入集群、管理 / 存储网正常
- 退出维护模式
- 开启数据平衡(仅本节点,避免全网冲击)
- 确认存储池状态正常、无告警
6)依次对剩下 5 台重复 2–5 步骤
必须做的关键动作(你容易漏的)
- ✅ 先关数据平衡再下电(否则集群会疯狂重构)
- ✅ 必须走维护模式(标记为计划性维护,不触发故障告警)
- ✅ 内存尽量同规格同批次(避免 NUMA 不均衡、性能抖动)
二、问题 2:新硬盘加入现有池还是新建池?官方建议?
先明确你新增的介质:
- 每节点:2×960G SSD(性能盘) + 2×10T SATA(容量盘)
- 原池大概率是:SAS/SATA HDD 或 混合(SSD 缓存 + HDD 容量)
官方原则(非常关键)
- 同类型、同规格硬盘才能进同一存储池
- SSD 和 SATA HDD 严禁混在一个池(性能、可靠性、分层策略都会乱)
- 6 节点全加相同盘,推荐:SSD 建独立高性能池,SATA 建独立大容量池;不建议直接混入原池
两种方案对比(结合你的场景)
方案 A:加入现有存储池(不推荐,除非原池就是同规格 SSD/SATA)
- 优点:统一池化、管理简单
- 致命问题:
- 原池若为 HDD:SSD 会被拖慢,无法发挥性能
- 原池若有 SSD 缓存:新增 SSD 无法作为缓存,只能当容量盘
- SATA HDD 混入原池(如 SAS):性能不一致、数据分布不均、重构风险高
方案 B:新建两个独立池(官方推荐,平滑 + 靠谱)
- SSD 池(高性能):6 节点 ×2×960G SSD → 全闪池,放数据库、核心业务
- SATA 池(大容量):6 节点 ×2×10T SATA → 归档、备份、冷数据
- 优点:
- 性能隔离:核心业务不被大容量盘拖累
- 风险隔离:某池故障不影响另一池
- 符合 UIS 硬盘池设计规范(最多支持 5 个池)H3C
- 后续可灵活分层、单独扩容
最终建议
直接新建两个独立池:SSD_Pool + SATA_Pool;原池保留旧数据,新业务跑新池,最平滑、最安全、官方首选。
三、问题 3:哪些步骤会影响业务?(风险点 + 规避)
1)单节点 VM 热迁移(低影响)
- 影响:VM 短暂卡顿(毫秒–秒级),网络微断
- 规避:业务低峰期迁移;6 节点冗余,迁移期间集群性能正常
2)节点下电→上电(无影响,前提:维护模式 + 关平衡)
- 正确操作:维护模式 + 关平衡→下电→上电→恢复
- 无影响:集群不重构、数据不动、业务无感
- 错误操作:直接下电→集群判定节点故障→触发全集群数据重构(带宽占满、性能暴跌、持续数小时)H3C
3)全网数据重平衡(高影响,必须避)
- 场景:6 台全部加完后,一次性开启所有节点平衡
- 影响:存储网打满、读写延迟飙升、业务卡顿
- 规避:逐台开启平衡,等一台平衡完再下一台;夜间低峰期做
4)新硬盘加入 / 创建存储池(低影响)
- 影响:仅初始化(几秒–分钟),无业务中断
- 规避:单节点操作,不跨节点批量执行
5)内存扩容本身(无影响)
四、整体时序(最稳、影响最小)
- 夜间低峰→节点 1:维护→迁 VM→关平衡→下电→加内存硬盘→上电→开平衡→退维护
- 等待节点 1 平衡完成(1–2 小时)
- 依次对节点 2–6 重复步骤 1–2
- 全部完成后→创建 SSD_Pool(6×2 SSD)、SATA_Pool(6×2 SATA)
- 新业务部署到新池;旧业务可平滑迁移到 SSD 池提速
五、一句话总结
- 问题 1:逐台迁虚机 + 维护模式 + 关平衡 + 硬件扩容,正确且安全;
- 问题 2:新建 SSD 高性能池 + SATA 大容量池,官方推荐、最平滑;
- 问题 3:错误下电引发全网重构风险最大;严格按维护流程操作,业务基本无感知。
暂无评论