• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

S10508X-V业务板卡故障

8小时前提问
  • 0关注
  • 0收藏,29浏览
粉丝:0人 关注:0人

问题描述:

华三核心交换机S10508X-V风扇FAN0故障,导致业务板卡温度过高超过阈值,自动下电,更换风扇模块后,业务板卡故障仍未消除,请问这种情况如何处理,如何恢复业务板卡西状态 slave DEV/2/BOARD_STATE_FAULT: Board state changed to Fault on slot 12, type is LsuM1FAB08XE0. %Apr 1 09:29:15:230 2026 Slave DEV/2/TEMPERATURE SHUTDOWN:-S1ot-14; Temperature is greater than the high-temperature shutdown threshold on slot 14 sensor hotspot 1. The siot will be powered off automatically.%Apr 1 09:29:19:755 2026 Slave DRVPLAT/2/DrvDebug: warning: slot li temperature is too high, power off it. please check it right now. XApr 1 09:29:19:755 2026 slave DRVPLAT/4/DrvDebug: hotspot 1 in slot 11 temperature(109) is too high and the board wil1 be shutdown. %Apr1 09:29:19:761 2026 51ave DEV/2/BOARD_STATE_FAULT: Board state changed to Fault on slot 11,type is LSUMJFAB08XE0 %Apr1 09:29:19:991 2026 slave DEV/3/FAN ABSENT: Fan 0 is absent. %Apr 1 09:29:24:338 2026 slave SHELL/6/SHELL_CMD: -Line=vty0-IPAddr-10.208.10.6-user=admin; Command is dis ip int brief %Apr 1 09:29:28:878 2026 STave DRVPLAT/2/DrvDebug: warnino: Slot 14 temperature is too high, power off it. please check it right now. %ADP1 09:29:28:878 2026 Slave DRVPLAT/4/DrvDebug: hutspot 1 in slot 14 temperature(109) is too high and the board will be shutdown. SAD 1 09:29:28:885 2026 5lave DEV/2/BOARD STATE FAULT: Board state changed to Fault on slot 14, type is LSUMIFABOBXEO %ADr 1 09:29:43:366 2026 STave DEV/2/TEMPERATURE_SHUTDOWN:-Slot-10; Temperature is greater than the high-temperature shutdown threshold an slot 10 sensor hotspot 1. The slot will he powered off automatically.%Apr 1 09:29:55:080 2026 Slave DRVPLAT/2/DrvDebug:Warning: slot 10 temperature is too high, power off it. please check it right now. 1 09:29:35:191 2026 slave DEV/3/FAN_ABSENT: Fan 1 is absent. %Apr %Apr 1 09:29:55:080 2026 5lave DRVPLAT/4/DrvDebug: hutspo

3 个回答
粉丝:2人 关注:9人

故障分析与处理步骤

根据告警信息,故障核心是12号槽位业务板卡因温度过高(由FAN0故障引发)触发保护性下电,状态变为Fault。更换风扇后板卡状态未自动恢复,需手动干预。

处理流程如下:

1. 检查当前状态:确认风扇、板卡及环境。
display fan
display environment
display device
重点确认所有风扇状态为Normal,设备整体温度已恢复正常。

2. 尝试恢复板卡:对故障板卡(slot 12)进行复位操作。
slot 12
reboot
注意:此操作会中断该板卡上所有业务,请在业务低峰期或经批准后操作。执行前建议保存配置 (`save force`) 并确认业务影响范围。

3. 检查复位后状态:执行 `display device` 查看slot 12板卡状态是否恢复为Normal。若恢复,则检查其端口及业务状态。

4. 若复位无效:如果板卡状态仍为Fault或无法启动,则可能是高温导致了硬件损坏。需要:
* 将板卡更换到其他正常槽位测试。
* 如果问题随板卡迁移,则更换该业务板卡。
* 如果更换槽位后板卡正常,则检查原槽位(12号)的背板或连接器。

总结:根本原因是高温保护。更换风扇解决了温升问题,但板卡需手动复位或更换才能恢复。优先执行软件复位,无效则进行硬件排查。

暂无评论

粉丝:8人 关注:0人

从日志看,S10508X-V交换机因为风扇FAN0和FAN1缺失导致多个槽位(10、11、12、14)温度过高,触发了自动下电保护。更换风扇模块后,板卡并不会自动恢复上电,需要手动恢复。



1. 确认风扇模块已恢复正常

先登录交换机(主控板,如果主备切换,确认当前主用主控),执行:

display fan
查看风扇状态,确保所有风扇在位且状态为Normal。如果仍有风扇显示AbsentFault,需要继续排查风扇模块是否插紧或模块本身故障。


2. 检查当前各槽位温度

执行:display environment

查看各槽位温度是否已降至正常范围内(通常应低于80℃)。如果温度依然过高(如日志中的109℃),可能是散热风道仍不畅通或机柜散热问题,需先解决环境温度问题,否则强行上电板卡可能再次过热下电。



3. 恢复业务板卡上电

温度正常后,板卡不会自动上电,需要手动操作。

方法一:通过命令行恢复

system-view
# 恢复槽位10(根据实际故障槽位替换) power-on slot 10 # 恢复其他槽位 power-on slot 11 power-on slot 12 power-on slot 14执行后稍等片刻,用 display device  display device slot 查看板卡状态是否变为Normal

方法二:如果板卡仍显示Fault,尝试先下电再上电

system-view
power-off slot 10 # 先下电 power-on slot 10 # 再上电
4. 确认板卡状态
display device
观察板卡状态应从Fault变为Normal。如果变为MasterStandby正常,业务应逐步恢复。


5. 后续观察

  • 持续监控温度和风扇状态,确保没有新告警。

  • 如果某个板卡始终无法恢复(仍显示Fault),可能是因长时间高温导致硬件损坏,需要更换板卡。

暂无评论

粉丝:6人 关注:2人

先把关键结论直接给你,再给你现场可立即执行的恢复步骤

核心结论

  1. 你这台是 S10508X-V 框式核心交换机,日志里明确:
    • Fan 0 is absent / Fan 1 is absent
    • 多个槽位 10、11、12、14 温度超过阈值(109℃)
    • 板卡因为高温保护自动下电,状态变为 FAULT
  2. 你虽然换了风扇,但风扇仍然没被系统识别
    日志还在报 Fan absent,说明:
    • 要么新风扇没插紧 / 没插到位
    • 要么风扇背板 / 机框风扇检测电路故障
    • 要么换的风扇型号不匹配
  3. 只要风扇还报 absent,散热就不正常,板卡就会持续高温、持续下电
    所以你换了风扇,业务板依然故障,这是正常连锁反应。

一、立刻要做的事(保命恢复业务)

1. 先确认风扇真的被识别了

执行:
plaintext
display fan
  • 如果依然显示 Absent / Abnormal
    → 散热根本没恢复,板卡必然继续高温保护

2. 强制给故障槽位下电、再重新上电

必须先高温下电的槽位手动复位,否则会一直锁在 FAULT 状态
plaintext
# 假设故障槽位 10、11、12、14 slot 10 offline slot 11 offline slot 12 offline slot 14 offline # 等待 1 分钟 slot 10 online slot 11 online slot 12 online slot 14 online

3. 立即查看温度是否下降

plaintext
display environment display temperature all
正常业务板热点温度应 **< 75℃**
如果还 >90℃ → 散热依旧异常,不能继续上线业务

二、为什么换了风扇还报 Fan absent?(99% 就这几个)

  1. 风扇没插到底,卡扣未卡紧
    • 机框后窗风扇仓要完全推入、听到咔嗒声
    • 轻微松动就会识别为 absent
  2. 风扇型号不匹配
    S10508X-V 有专用风扇模块:
    • LSWM1FANSC 或 LSWM2FANSC 等
      用老款 S10508、S10504 风扇会不识别或转速异常
  3. 风扇供电 / 检测背板故障
    • 风扇正常,但机框内部检测电路坏
    • 表现:风扇在转,但系统一直报 absent
      → 这种只能报修机框
  4. 主备引擎 / 机框内部通信异常
    日志出现大量 Slave 异常,说明备用引擎也在高温报警
    整机风道堵死,不是单块板卡问题。

三、业务板卡在 FAULT 状态,如何强制恢复?

板卡一旦进入高温 FAULT,不会自动恢复,必须手动干预:
  1. 确认风扇正常:display fan 全部 Normal
  2. 确认温度正常:display temperature all 全部正常
  3. 对故障槽执行:
    plaintext
    slot x offline slot x online
  4. 查看状态:
    plaintext
    display device
    FaultNormal 才算恢复。

四、如果你现在风扇仍然报 Absent,禁止强行上线板卡

继续强行上线会:
  • 再次高温触发保护
  • 反复上下电损伤芯片
  • 严重可永久烧坏业务板 / 交换网板

五、最简可执行恢复流程(现场直接照做)

  1. 重新插拔所有风扇,确认卡扣到位
  2. display fan 确保无 absent
  3. display temperature 确认温度降到 70℃ 以内
  4. 对 10、11、12、14 槽依次 offline + online
  5. display device 观察是否恢复 Normal
  6. 仍 Fault → 该板卡已受高温损伤,需备件更换

六、你可以现在发我这两条输出,我直接判断病根

plaintext
display fan

plaintext
display device display temperature all

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明