问

H3C超融合服务器的缓存盘即将到使用期限应该怎么进行更换

UIS超融合

2026-03-18提问

0关注
1收藏，543浏览

zhiliao_imMjN0

zhiliao_imMjN0 二段

粉丝：1人关注：2人

问题描述：

H3C超融合服务器的缓存盘健康度不够了，即将到使用期限，需要对他们集体进行更换，可以直接进行拔插更换吗

4 个回答

按时间按赞数

zhiliao_Gixe

zhiliao_Gixe 七段

粉丝：12人关注：9人

对于H3C UIS超融合服务器缓存盘即将到使用期限的情况。

一、不能直接拔插更换
1. 数据完整性风险
- 缓存盘中可能存储着正在处理或者即将写入磁盘的数据，如果直接拔插，会导致数据丢失或者损坏。例如，在缓存中的写入操作可能还没有完全同步到后端存储。
2. 系统状态影响
- 超融合系统的运行依赖于缓存盘的稳定状态，突然拔插可能会使系统进入不稳定状态，甚至导致节点重启或者整个集群出现故障。

二、正确的更换步骤
1. 查看当前缓存盘状态
- 使用UIS的管理界面查看缓存盘的健康状态、使用比例等信息。在管理界面中可以直观地看到每个缓存盘的相关指标。
2. 准备新缓存盘
- 确保新缓存盘的规格（如容量、接口类型等）与原缓存盘一致。
3. 迁移数据（如果有必要）
- 根据超融合系统的版本和功能，可能需要先将缓存中的数据迁移到其他存储位置或者临时存储区域。这一过程可能需要参考具体的产品文档，有些系统可能会有自动迁移的功能。
4. 更换缓存盘
- 在确保系统处于合适的状态（如没有大规模的数据读写操作）下，按照设备的硬件操作手册，安全地拔出旧缓存盘并插入新缓存盘。
5. 重新初始化和同步
- 新缓存盘插入后，系统会自动检测到新硬件并进行初始化。之后需要对缓存数据进行同步操作，使新缓存盘能够正常工作。这一过程可能需要一定的时间，并且要关注系统的日志输出，确保没有错误提示。
6. 验证更换结果
- 再次查看管理界面中的缓存盘状态，检查健康度是否恢复正常，同时进行一些简单的读写测试，确保超融合系统能够正常使用缓存盘的功能。

暂无评论

zhiliao_sEUyB

zhiliao_sEUyB 九段

粉丝：133人关注：11人

2.5.3 缓存盘更换

E52xx和R52xx版本的存储系统缓存盘有3个挂载的OSD，一个为row池的OSD，另外两个OSD为CSD。

1. 记录缓存盘的osd和加速的数据盘的osd的fsid

(1) SSH登录到故障节点的后台命令行，执行ceph osd tree down，找到状态为down的OSD编号，如下图所示：

其中osd.1是row池的OSD，osd.4和osd.7是CSD，其余的OSD是加速的数据盘。

(2) 进入故障OSD的挂载点cd /var/lib/ceph/osd/ceph-x，记录下该OSD的fsid信息（需要记录所有故障OSD的fsid信息，包括缓存盘的CSD），如下图所示。

2. 拔下故障盘，换上新盘

请参见拔下故障盘并换上新盘章节操作。

3. 删除数据盘

(1) 使用命令ceph osd tree down查看down的数据盘，本例中down的数据盘为osd.9、osd.12、osd.15、osd.18、osd.21。

(2) 取消故障硬盘的挂载，执行mount命令查看该OSD的挂载信息与对应的盘符，如图osd.9对应的盘符为sdac1。

执行umount /var/lib/ceph/osd/ceph-9命令，取消故障硬盘的挂载。

(3) 执行以下命令将osd删除，其中x为osd编号，需要按照实际情况修改，注意不要删错。

ceph osd crush remove osd.x

ceph auth del osd.x

ceph osd rm osd.x

(4) 格式化对应磁盘，执行命令sudo sgdisk -o /dev/sdac1。

格式化完成后此时执行lsblk可以看到sdac下已不存在分区。

(5) 对剩余down掉的OSD执行（2）（3）（4）操作步骤。

4. 数据库清除OSD信息

(1) 在主handy节点登录数据库，输入命令mariadbsql -ucalamari -p27HbZwr*g calamari进入数据库。如图所示：

(2) 根据记录的OSD的fsid信息筛选出需要删除的OSD，确认是故障的OSD编号。

select * from op_cluster_osd_config where osd_uuid=’9a41a0f9-01db-44e2-bc6d-57393c323be6’;

(3) 执行如下命令在数据库中删除对应的OSD的信息。

delete from op_cluster_osd_config where osd_uuid='9a41a0f9-01db-44e2-bc6d-57393c323be6’;

(4) 请依次执行步骤（2）和步骤（3）将所有故障的OSD删除掉（包括缓存盘的OSD、CSD以及数据盘的OSD）。

5. 将数据盘和缓存盘加入集群

登录UIS超融合管理平台，在硬盘管理页面，单击硬盘操作列的图标，在弹出页面将新加入的数据盘和缓存盘加回硬盘池。

暂无评论

zhiliao_v6hOyc

zhiliao_v6hOyc 九段

粉丝：44人关注：1人

需要一台一台更换，周期较长，可能一天换一块，等集群状态处于health_ok再进行下一台

暂无评论

刘浩存

刘浩存九段

粉丝：23人关注：1人

H3C UIS超融合环境（特别是您提到的E0721P01版本），绝对不能直接对缓存盘进行拔插更换。这样做可能会导致数据丢失或存储池故障。

为什么不能直接拔插？
1. 数据一致性问题：缓存盘中存储的是热点数据或待回写的数据，直接拔盘会导致这些数据无法写入数据盘，造成数据不一致甚至丢失。
2. 系统识别问题：UIS系统有自己的一套磁盘管理机制，直接拔插后系统可能无法自动识别新盘并重建缓存层，导致更换失败。
3. 分区残留问题：旧缓存盘上的分区信息（如LVM或分区表）残留在系统中，新盘插入后如果不清理分区，会导致系统无法正确初始化

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

H3C超融合服务器的缓存盘即将到使用期限应该怎么进行更换

问题描述：

2.5.3 缓存盘更换

1. 记录缓存盘的osd和加速的数据盘的osd的fsid

2. 拔下故障盘，换上新盘

3. 删除数据盘

4. 数据库清除OSD信息

5. 将数据盘和缓存盘加入集群

为什么不能直接拔插？

推荐的标准更换流程

第一阶段：准备工作

第二阶段：软件层面移除（关键步骤）

第三阶段：物理更换与重建

第四阶段：循环操作

编辑答案

提出建议