3PAR 8400 盘笼 Cage 故障电源完整定位方案(匹配你现场:整机面板告警、Web 告警、单电源模块指示灯正常)
一、先理清故障现象成因
整机前面板橙色故障灯常亮是系统全局告警汇总灯,只要任意硬件(盘笼电源 / 风扇 / IO 卡)存在异常就会点亮;
单电源模块自身绿灯没变红,代表电源基础供电正常,但存在隐性故障(电压偏移、通讯异常、固件读取异常),属于底层微码上报告警,模块本地指示灯不触发故障。
二、分步定位故障 Cage + 故障电源(先 CLI 精准定位,再物理点亮指示灯)
步骤 1:SSH 登录 3PAR CLI,查看完整告警,锁定故障机框 ID
cli
# 1. 查看全量告警,直接打印故障cage、电源编号
showalert
输出会明确标注:Cage cageX Power supply PS0/PS1 fault,记录 cage 编号(如 cage2)、PS 编号 0/1。
cli
# 2. 查看所有盘笼完整硬件信息,核对电源状态
showcage -d all
重点字段:
Cage ID:机框编号
Power Supply 0/1 State:OK/Fault(故障电源会标 Fault)
Firmware Version:你之前遇到的 Unknown 也会在此展示
步骤 2:单独查看所有盘笼电源明细,精准匹配 Cage 与 PS
cli
# 列出每台cage对应的两个电源模块状态
showps
输出格式示例:
plaintext
Cage PS Name State
2 0 Power Supply 0 OK
2 1 Power Supply 1 Fault
直接得到:故障机框 cage2,故障电源 PS1。
步骤 3:命令点亮故障 Cage 定位灯(现场肉眼快速找到对应盘笼)
执行定位命令,故障盘笼前面板蓝色 UID 指示灯长亮,方便机房多台存储区分机框:
cli
# cage2亮灯300秒,可自行调整秒数
locatecage -t 300 cage2
整机面板说明:
橙色总故障灯:全局硬件异常就亮(你现场已点亮)
数字显示屏:显示故障 Cage 编号,可直接对照
步骤 4:进入故障 Cage 背面,确认物理电源槽位
每台盘笼后侧有 2 个电源槽位,从左到右依次为 PS0、PS1:
对应showps输出的 PS 编号;
虽然电源模块绿色 OK 灯正常,但系统判定硬件异常,直接更换该槽位电源即可。
三、补充:控制器 Node 柜电源区分(避免混淆盘笼 Cage 电源)
如果告警不是盘笼而是控制器机头电源,用以下命令查看:
cli
shownode -s
shownodeenv
机头电源为 Node0/Node1 内置 PCM 供电模块,和磁盘 Cage 电源命令分开,不要混淆。
四、为什么电源模块指示灯正常但系统报故障(你的场景根源)
电源交流输入、直流输出基础供电正常,所以模块绿色 OK 灯不灭;
电源内部监测电路检测到电压轻微偏移、风扇转速偏低、PSE 固件通讯中断,上报上层存储系统;
盘笼背板与电源的 I2C 管理总线瞬时断连,系统无法读取电源完整状态,标记 Fault,但基础供电不中断;
仅整机面板汇总告警灯点亮,单电源模块本地故障灯不触发。
五、定位后修复操作
确认另一路电源正常,支持热插拔更换;
拔出故障 PS 槽位电源,静置 30 秒插回测试;
重新刷新盘笼固件同步状态:
cli
upgradecage cage2
仍告警则直接更换同型号电源备件。
极简总结定位流程
showalert → 得到故障 cage+PS 编号
showps / showcage -d cageX → 确认电源故障状态
locatecage cageX → 点亮机框蓝色定位灯,现场找到对应盘笼
盘笼后侧从左至右 PS0/PS1,对应命令输出编号,即为故障电源
暂无评论
showpsu 命令:查看系统中所有电源模块的当前状态、所属 Cage 编号以及具体的电源模块编号(如 PCM0、PCM1)。showpsu -d 或 showpsu -detail 命令:获取更详细的电源状态信息,包括输入电压、电流、温度以及具体的错误代码。showeventlog 命令,过滤与电源(PSU/PCM)相关的告警信息,日志中通常会明确指出是哪个 Cage 的哪个电源模块出现了何种故障。暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论