Power Supply Failures(电源故障)或温度过高的告警记录。暂无评论
先给结论:ME8000 红灯闪烁、10 分钟左右自动关机,90% 是散热过热保护,其次是电源模块老化 / 输出不稳。下面给你一套直接能用的排查 + 处理步骤。
一、先看指示灯含义(ME8000)
ALM/FAULT 红灯闪烁:系统级告警(温度 / 电源 / 硬件)
RUN 绿灯:正常运行
现象对应:开机红灯闪 → 慢慢升温 → 10 分钟触发过热保护关机
二、第一步:快速现场排查(不用进系统)
电源侧
看电源模块指示灯:INPUT(市电)、OUTPUT(输出)、FAULT(故障)
换一根已知好的电源线、换一个插座;有冗余电源就单电源轮流拔插,看是否某路导致红灯
摸电源外壳:是否异常烫、有焦味、风扇不转
散热 / 风扇侧(最常见)
开机听:机箱风扇、CPU 风扇是否都在转
看前面板 / 出风口:灰尘是否堵死(ME8000 长期不清理很常见)
机房温度:是否 > 30℃、出风口是否被挡住
10 分钟内机身是否明显烫手(CPU / 主板过热)
三、第二步:进系统查日志确认(能进系统时)
console/SSH 登录 ME8000(Linux 系):
bash
运行
# 1. 查温度(重点)
sensors
# 看 CPU、主板、硬盘温度,正常:CPU 40–65℃,超过80℃必保护关机
# 2. 查风扇转速
fancontrol 或 cat /sys/devices/platform/.../fan1_input
# 正常:1000–3000rpm,为0或极低=风扇坏/堵
# 3. 查电源/硬件日志
dmesg | grep -i power
dmesg | grep -i thermal
# 常见报错:thermal shutdown、power supply failure
# 4. 查系统日志
tail -f /var/log/messages
典型报错:
thermal: critical temperature reached, shutting down → 过热保护
power supply unit fault → 电源模块故障
四、第三步:对应处理(按概率从高到低)
场景 A:散热堵 / 风扇坏(概率最高)
断电 → 拆机箱
彻底清灰:CPU 散热器、机箱风扇、电源风扇、出风口
检查 CPU 风扇:是否卡死、线松、电机坏 → 坏就换同规格风扇
重新涂硅脂(CPU 与散热器之间)
开机测试:红灯消失、10 分钟不关机 → 解决
场景 B:电源模块老化 / 带载差
有冗余电源:逐个替换,找到导致红灯的坏模块并更换
无冗余:换一个同功率、同规格新电源
测试:开机红灯灭、长时间运行不关机
场景 C:主板 / CPU 隐性故障(清灰换电源后仍红灯)
大概率是主板电容鼓包、VRM 供电不稳、CPU 老化
建议:联系厂商售后(H3C 400)做硬件检测 + 更换主板 / CPU
五、临时应急(紧急业务)
机房开空调降温(≤25℃)
机箱侧盖打开,外加强力风扇直吹
减少业务负载(停非必要服务)
仅临时用,尽快彻底解决散热 / 电源问题
六、你现在可以马上做的 3 件事
看电源指示灯、听风扇是否全转
断电清灰(重点出风口、CPU 风扇)
开机观察:红灯是否消失、10 分钟是否关机
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论