存储进行初始化了,设置后发下扩展柜里的盘都问号了,想问问这个能重置 degraded为normal吗?
S7200C cli% showpd -c
------- Normal Chunklets -------- ---- Spare Chunklets ----
- Used - -------- Unused -------- - Used - ---- Unused ----
Id CagePos Type State Total OK Fail Free Uninit Unavail Fail OK Fail Free Uninit Fail
--- 1:0:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:1:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:2:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:3:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:4:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:5:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:6:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:7:0? SSD degraded 446 0 0 0 0 0 0 0 0 0 0 0
--- 1:8:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:9:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:10:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:11:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:12:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:13:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:14:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
--- 1:15:0? SSD degraded 1787 0 0 0 0 0 0 0 0 0 0 0
从您的命令输出可以看到一个非常明显的问题:所有磁盘的 CagePos
(笼子位置)都显示为 1:0:0?
这样的问号形式。这表示3PAR存储系统的控制器无法正确识别到扩展柜的物理结构或磁盘的物理位置。
CagePos
格式应为 Cage:Mag:Slot
(机柜:杂志位:槽位),正常的显示不应有问号。State
为 degraded
(降级)是结果,而不是原因。原因是控制器无法与扩展柜中的磁盘建立稳定、可靠的通信。结论:这极大概率是一个硬件连接或识别问题,而不是一个可以通过软件命令简单重置的状态问题。 直接尝试将状态改为 normal
是无法成功的,因为根本的物理通信问题没有解决。
请按照以下步骤从易到难进行排查:
这是首要且最需要检查的环节。问题很可能出在扩展柜与主柜之间的连接上。
SFP+ 光纤线缆/模块:
电源和硬件状态:
showcage
命令查看扩展柜的状态是否正常。如果扩展柜本身无法被识别,那么其中的磁盘自然也无法被识别。controldisk shelf
相关的命令,但具体命令需根据版本确定。showcage
和 showsys
命令,查看系统是否能识别到扩展柜本身,以及整个系统的硬件状态报告。showpd -c
的输出结果。showcage
命令的输出。showsys
命令的输出。工程师可以通过这些信息快速定位是线缆、模块、扩展柜背板还是兼容性问题,并能安全地引导您进行下一步操作(如必要的磁盘扫描),避免数据丢失的风险。
总而言之,不要试图去重置 degraded
状态,而应去解决导致状态为 degraded
的根本原因——硬件连接或识别故障。
One or more alerts were generated that were not expected:
Id : 1
State : New
Message Code: 0x01a0015
Time : 2025-09-02 17:12:15 CST
Severity : Major
Type : Node PCIe Correctable Error Status
Message : Node 0: Correctable PCIe error count limit exceeded.
Id : 2
State : New
Message Code: 0x01a0015
Time : 2025-09-02 17:12:16 CST
Severity : Major
Type : Node PCIe Correctable Error Status
Message : Node 1: Correctable PCIe error count limit exceeded.
2 alerts
These alerts may indicate issues with the system; please see the Messages and
Operator's Guide for details on the meaning of individual alerts.
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论