问

CF8400 其中node2 系统SSD已经处于Failed状态,要更换ssd卡文档

2026-04-10提问

0关注
0收藏，749浏览

北向

北向零段

粉丝：0人关注：1人

问题描述：

其中node2 系统SSD已经处于Failed状态，但是node2并没有宕，因为 Node 2 is not being shutdown by the system even though there are internal drive errors because some LDs cannot be served by the remaining nodes 处于只读状态。

2 个回答

按时间按赞数

已采纳

zhiliao_GeOM0O

zhiliao_GeOM0O 九段

粉丝：23人关注：2人

你当前的情况是 3PAR CF8400（8400 系列）Node2 系统 SSD Failed，但节点未关机、系统只读保护，属于典型的 “系统盘（boot SSD）故障但节点仍在线、数据 LD 无法完全冗余切换” 场景。

下面给你 官方标准更换流程 + 只读状态处理 + 命令清单，可直接照着做。

一、先确认现状（关键）

1. 确认故障盘类型与位置

系统 SSD（boot SSD）在 控制器节点内部（Node 后端 / 侧面），不是业务盘笼（cage）里的 SSD。

bash

运行

# 1. 查看节点状态
showsys -node

# 2. 查看 PD 状态（确认系统盘 failed）
showpd -c -failed
showpd -i | grep -i node2

你会看到类似：

Node2
PD ID: XX
Type: SSD (boot/system)
State: failed
提示：some LDs cannot be served by remaining nodes → read-only

2. 只读状态说明

系统检测到 Node2 系统盘故障，但剩余节点无法承载所有 LD 冗余 → 不自动关机 Node2
系统进入 保护模式：所有主机 I/O 只读（read-only）
必须先更换系统盘 → 重建节点系统 → 恢复冗余 → 解除只读

二、更换前准备（必须）

备件要求
- 同型号 3PAR CF8400 专用系统 SSD（HPE 原厂备件，一般 120GB/240GB SATA SSD）
- 带 防静电手环
工具
- SSH 客户端（连接 SP 或节点 IP）
- 笔记本 + 串口线（备用，防止网络失联）
- 一字螺丝刀 / 手拧螺丝
业务影响
- 更换期间 Node2 仍在线只读
- 更换完成、节点重启重建系统后 自动恢复读写
- 全程 不影响另一节点（Node1）正常 I/O（多路径主机自动切走）

三、标准更换步骤（官方流程）

步骤 1：确认 Node2 可安全维护

bash

运行

# 查看节点状态
shownode
# Node2 应为：Up/Failed (system disk)
# 确认：Node1 正常、集群正常（2-node cluster degraded）

# 查看是否有正在进行的 servicemag
servicemag status
# 确保无进行中任务

步骤 2：关闭 Node2（安全关机）

必须先关机再拔盘，不能直接热拔系统 SSD

bash

运行

# 方式1：CLI 关机
shutdown node 2
# 等待 2~3 分钟

# 确认 Node2 已关机
shownode
# Node2 State: Down/PoweredOff

面板：Node2 状态灯 熄灭 / 橙灯常亮

步骤 3：定位并更换 Node2 系统 SSD

CF8400 系统 SSD 位置：

每个 Node 后端 / 侧面 2.5 寸槽位（标：Boot SSD / System SSD）
一般 2 块系统 SSD（RAID1），你是其中 1 块 Failed

物理更换（图解）

戴防静电手环
找到 Node2 故障 SSD：橙灯常亮
捏卡扣→拉开把手→缓慢抽出 SSD（等待 30 秒）
插入新原厂 SSD：对齐→推入→扣紧把手
检查：SSD 状态灯 绿闪 / 绿常亮

步骤 4：开机 Node2 → 自动重建系统

bash

运行

# 开机 Node2
start node 2

# 监控节点启动
shownode
# 状态：Starting → Booting → Up (degraded)

# 监控系统盘重建
showpd -i
# 新 SSD 状态：
# degraded → rebuilding → normal

系统自动将 好的系统盘镜像到新 SSD（RAID1 重建）
全程约 10~20 分钟（看 SSD 大小）

步骤 5：解除只读状态（自动 / 手动）

重建完成后，系统自动检测冗余恢复 → 退出只读模式

bash

运行

# 1. 检查系统健康
checkhealth -detail
# 应无：read-only、failed system disk

# 2. 确认节点状态
shownode
# Node1/Node2 均：Up (normal)

# 3. 确认 PD 正常
showpd -c -failed
# 无输出

# 4. 若仍只读（极少）：手动刷新
setsys readwrite forced

步骤 6：验证业务恢复

主机端：I/O 恢复读写
告警：清除 Failed SSD 告警

bash

运行

# 确认所有状态正常
showsys
checkhealth -detail

四、常用命令清单（直接复制）

bash

运行

# 查看节点
shownode
showsys -node

# 查看磁盘
showpd -i
showpd -c -failed

# 关机/开机
shutdown node 2
start node 2

# 监控重建
servicemag status
showpd -rebuild

# 健康检查
checkhealth -detail

# 解除只读（如需要）
setsys readwrite forced

五、注意事项（避坑）

系统盘 ≠ 业务盘
- 不要去业务盘笼（cage0/cage1）找，在 Node 本体上
必须关机再换
- 系统 SSD 不支持热拔，强制热拔会损坏节点主板
备件必须原厂
- 普通 SSD 不认，必须 3PAR CF8400 专用系统 SSD
只读是保护
- 不要强行关闭只读，换盘重建完自动解除

六、你现在可以立即执行

用 shownode / showpd -c -failed 确认 Node2 系统盘 Failed
执行 shutdown node 2 安全关机
更换 Node2 上 橙灯亮的系统 SSD
start node 2 → 等待重建 → 自动恢复读写

您好老师，目前阵列属于四控制器组合，node2产生控制器内部ssd故障，目前掌握的信息是这个case 不适用于简单更换SSD或者控制器的操作，目前控制器是只读状态并没有挂的，因为有只归属于的该node的 LD在运行的，是否要将这个case需要升级到二线级别确认更换方案！

北向发表时间：2026-04-10 更多>>

北向发表时间：2026-04-10

刘浩存

刘浩存九段

粉丝：26人关注：1人

你这台CF8400设备正处在一种特殊状态：系统盘（SSD）虽然报“Failed”，但整个节点没有宕机，而是以只读模式在运行。这通常是存储系统为保证数据安全而采取的降级保护措施，现在不建议强制关机。

在动手更换前，请务必完成以下准备：

确认硬件兼容性：准备一块型号和容量都完全匹配的备件盘。可以参考你之前获取硬盘信息的方法，再次核实槽位兼容性。
备份所有关键数据：这是最重要的一步。在开始任何操作前，务必确认所有关键业务数据都已完整备份。
准备好远程连接：确保你能通过SSH或串口（Console）等方式登录到存储系统的管理界面。
备好操作环境：准备好螺丝刀和防静电手环等工具。

第一步：识别故障盘位置

登录CF8400存储控制器，执行showsys命令，确认当前操作的设备就是有故障的那台。接着用checkhealth -detail命令全面检查系统健康状况，如果发现其他严重问题，最好先处理完再换盘。

然后，通过showpd命令定位故障盘：

showpd -failed 这个命令会列出所有故障盘，记下故障盘的CagePos（即cage:slot格式）位置。比如，0:7就代表0号盘柜的7号槽位。
特别警告：再次确认输出中盘的状态是 failed 而不是 degraded。如果是 degraded，说明系统可能还在腾空数据，此时强行拔出会有数据丢失的风险。

第二步：执行热更换

进入维护模式：在更换硬件前，需要让节点进入维护模式。如果是双机热备环境，务必先将该节点切换为备节点。
物理更换硬盘：登录管理平台，进入硬件更换向导（如一键 > 硬件更换）。通过GUI界面让主机进入维护模式，执行shutdown正常关机，然后按提示完成物理更换。
重新加入集群：新盘插入后，系统会自动识别并重建数据。请通过showpd -p或Web界面耐心监控数据重建进度，完成后将节点退出维护模式，重新加入集群。

编辑答案

分享扩散:

➤

网站相关: 关于我们; 服务条款; 隐私政策; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

侵犯我的权益 >

对根叔社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

CF8400 其中node2 系统SSD已经处于Failed状态,要更换ssd卡文档

问题描述：

一、先确认现状（关键）

1. 确认故障盘类型与位置

2. 只读状态说明

二、更换前准备（必须）

三、标准更换步骤（官方流程）

步骤 1：确认 Node2 可安全维护

步骤 2：关闭 Node2（安全关机）

步骤 3：定位并更换 Node2 系统 SSD

物理更换（图解）

步骤 4：开机 Node2 → 自动重建系统

步骤 5：解除只读状态（自动 / 手动）

步骤 6：验证业务恢复

四、常用命令清单（直接复制）

五、注意事项（避坑）

六、你现在可以立即执行

第一步：识别故障盘位置

第二步：执行热更换

编辑答案

提出建议