• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

H3C超融合服务器的缓存盘即将到使用期限应该怎么进行更换

20小时前提问
  • 0关注
  • 0收藏,52浏览
粉丝:1人 关注:2人

问题描述:

H3C超融合服务器的缓存盘健康度不够了,即将到使用期限,需要对他们集体进行更换,可以直接进行拔插更换吗

4 个回答
粉丝:0人 关注:9人

对于H3C UIS超融合服务器缓存盘即将到使用期限的情况。

一、不能直接拔插更换
1. 数据完整性风险
- 缓存盘中可能存储着正在处理或者即将写入磁盘的数据,如果直接拔插,会导致数据丢失或者损坏。例如,在缓存中的写入操作可能还没有完全同步到后端存储。
2. 系统状态影响
- 超融合系统的运行依赖于缓存盘的稳定状态,突然拔插可能会使系统进入不稳定状态,甚至导致节点重启或者整个集群出现故障。

二、正确的更换步骤
1. 查看当前缓存盘状态
- 使用UIS的管理界面查看缓存盘的健康状态、使用比例等信息。在管理界面中可以直观地看到每个缓存盘的相关指标。
2. 准备新缓存盘
- 确保新缓存盘的规格(如容量、接口类型等)与原缓存盘一致。
3. 迁移数据(如果有必要)
- 根据超融合系统的版本和功能,可能需要先将缓存中的数据迁移到其他存储位置或者临时存储区域。这一过程可能需要参考具体的产品文档,有些系统可能会有自动迁移的功能。
4. 更换缓存盘
- 在确保系统处于合适的状态(如没有大规模的数据读写操作)下,按照设备的硬件操作手册,安全地拔出旧缓存盘并插入新缓存盘。
5. 重新初始化和同步
- 新缓存盘插入后,系统会自动检测到新硬件并进行初始化。之后需要对缓存数据进行同步操作,使新缓存盘能够正常工作。这一过程可能需要一定的时间,并且要关注系统的日志输出,确保没有错误提示。
6. 验证更换结果
- 再次查看管理界面中的缓存盘状态,检查健康度是否恢复正常,同时进行一些简单的读写测试,确保超融合系统能够正常使用缓存盘的功能。

暂无评论

粉丝:98人 关注:11人

2.5.3  缓存盘更换

E52xxR52xx版本的存储系统缓存盘有3个挂载的OSD,一个为row池的OSD,另外两个OSDCSD

1. 记录缓存盘的osd和加速的数据盘的osdfsid

(1)     SSH登录到故障节点的后台命令行,执行ceph osd tree down,找到状态为downOSD编号,如下图所示:

 

其中osd.1row池的OSDosd.4osd.7CSD,其余的OSD是加速的数据盘。

(2)     进入故障OSD的挂载点cd /var/lib/ceph/osd/ceph-x,记录下该OSDfsid信息(需要记录所有故障OSDfsid信息,包括缓存盘的CSD,如下图所示

 

2. 拔下故障盘,换上新盘

请参见拔下故障盘并换上新盘章节操作。

3. 删除数据盘

(1)     使用命令ceph osd tree down查看down的数据盘,本例down的数据盘为osd.9osd.12osd.15osd.18osd.21

 

(2)     取消故障硬盘的挂载,执行mount命令查看该OSD的挂载信息与对应的盘符,如图osd.9对应的盘符为sdac1

 

执行umount /var/lib/ceph/osd/ceph-9命令,取消故障硬盘的挂载。

 

(3)     执行以下命令将osd删除,其中xosd编号,需要按照实际情况修改,注意不要删错。

ceph osd crush remove osd.x

ceph auth del osd.x

ceph osd rm osd.x

(4)     格式化对应磁盘执行命令sudo sgdisk -o /dev/sdac1

格式化完成后此时执行lsblk可以看到sdac下已不存在分区。

(5)     对剩余down掉的OSD执行(2)(3)(4)操作步骤。

4. 数据库清除OSD信息

(1)     在主handy节点登录数据库,输入命令mariadbsql -ucalamari -p27HbZwr*g calamari进入数据库。如图所示:

 

(2)     根据记录的OSDfsid信息筛选出需要删除的OSD,确认是故障的OSD编号。

select * from op_cluster_osd_config where osd_uuid=’9a41a0f9-01db-44e2-bc6d-57393c323be6’;

 

(3)     执行如下命令在数据库中删除对应的OSD的信息。

delete  from op_cluster_osd_config where osd_uuid='9a41a0f9-01db-44e2-bc6d-57393c323be6’;

 

(4)     请依次执行步骤(2)和步骤(3)将所有故障的OSD删除掉(包括缓存盘的OSDCSD以及数据盘的OSD)。

5. 将数据盘和缓存盘加入集群

登录UIS超融合管理平台,在硬盘管理页面,单击硬盘操作列的图标,在弹出页面将新加入的数据盘和缓存盘加回硬盘池。

暂无评论

粉丝:43人 关注:1人

需要一台一台更换,周期较长,可能一天换一块,等集群状态处于health_ok再进行下一台

暂无评论

粉丝:6人 关注:0人

H3C UIS超融合环境(特别是您提到的E0721P01版本),绝对不能直接对缓存盘进行拔插更换。这样做可能会导致数据丢失或存储池故障。

  • 为什么不能直接拔插?

    1. 数据一致性问题:缓存盘中存储的是热点数据或待回写的数据,直接拔盘会导致这些数据无法写入数据盘,造成数据不一致甚至丢失。

    2. 系统识别问题:UIS系统有自己的一套磁盘管理机制,直接拔插后系统可能无法自动识别新盘并重建缓存层,导致更换失败。

    3. 分区残留问题:旧缓存盘上的分区信息(如LVM或分区表)残留在系统中,新盘插入后如果不清理分区,会导致系统无法正确初始化

推荐的标准更换流程

建议您按照“单盘轮换”的方式进行,即:更换完一块并等待数据平衡后,再更换下一块。

第一阶段:准备工作

  1. 数据备份:虽然是预防性更换,但操作存储底层仍有风险,务必提前备份重要业务数据。
  2. 确认位置:登录H3C UIS管理界面或底层后台,确认即将过期的缓存盘对应的物理槽位(Slot)和盘符(如 /dev/sda 或 NVMe编号)。
  3. 检查健康度:确认当前集群状态为健康(Health OK),没有其他磁盘故障。

第二阶段:软件层面移除(关键步骤)

在物理拔盘之前,必须先在系统内部将该盘“剔除”,让系统知道这块盘要下线了。
  • 如果是写缓存盘(Journal SSD):
    通常需要先停止相关OSD服务,移除Journal分区映射。
    • 操作逻辑:卸载挂载 -> 移除软连接(dmsetup remove) -> 删除OSD记录(ceph osd crush remove 等命令)。
  • 如果是读加速盘(Flashcache):
    需要清除加速配置。
    • 操作逻辑:找到对应的加速分区 -> 解除加速绑定 -> 清理分区信息。
注意:具体的命令行操作(如 ceph 命令或 dmsetup)非常依赖您的UIS具体版本(如UIS 6.5, 7.0, 8.0等)。强烈建议您在进行此步骤时,参考对应版本的《部件更换配置指导》或直接联系H3C 400客服获取针对您版本的“缓存盘移除指令”

第三阶段:物理更换与重建

  1. 物理拔出:在软件层面显示该盘已移除或故障后,按下硬盘面板按钮,拔出旧盘。
  2. 插入新盘:插入同规格或兼容的新硬盘。
    • H3C服务器通常支持自动识别新盘。
    • 新盘插入后,系统可能会自动将其配置为热备盘或直接开始重建(Rebuild)。
  3. 等待数据平衡(最重要的一步)
    • 插入新盘后,后台会开始数据同步或重建缓存。
    • 必须等待存储健康度恢复到 100% (HEALTH_OK),且数据平衡(Rebalance/Recover)进度完成。
    • 可以通过后台命令(如 ceph -s)查看状态,确保没有 recovering 或 backfilling 的卡滞任务。

第四阶段:循环操作

只有当第一块新盘的状态完全正常,集群健康度回到100%后,才能开始对第二块缓存盘执行上述流程。


暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明