最佳答案
你这个现象非常典型:S7506E 重启后两块 LSQ1GP24SC0 光板同时 Fault、换槽也不行、单独重启板无效、版本 V5.2 6605P03 → 基本锁定是 版本兼容性 + 启动加载异常 + 供电 / 自检卡住 三重问题。
下面给你 现场可直接执行的排障 + 修复步骤(按优先级)。
一、先确认关键信息(命令)
bash
运行
display device # 看两块光板是否 Fault
display logbuffer | include "BOARD_STATE_FAULT|LSQ1GP24SC0|version"
display version # 确认:S7506E-V5.2 6605P03
display power
display fan
display device manuinfo # 看LSQ1GP24SC0 单板CPLD/Bootrom版本
典型日志你会看到:
plaintext
%DEV/2/BOARD_STATE_FAULT: Board state changes to FAULT on Chassis 0 Slot X
%LINEPDA: Failed to download firmware to slot X
%DRV_ERR: Failed to initialize chip on slot X
二、最可能原因(S7506E V5 + LSQ1GP24SC0)
V5.2 6605P03 对早期 LSQ1GP24SC0 兼容性差
6605P03 是较老版本,对这批光板 CPLD / 驱动加载失败
重启后单板自检超时 / 固件下发失败
两块同时 Fault → 不是单块硬件坏,是软件 / 加载机制
电源冗余 / 功率不足(隐性)
重启瞬间浪涌 → 光板供电异常
单板 Bootrom/CPLD 太老,与 V5 主控不匹配
三、现场可立即做的修复(按顺序)
1)强制重启单板 + 重新注册(最常用)
bash
运行
# 假设Fault在Slot 2、Slot 3
slot 2 reboot
slot 3 reboot
wait 3分钟
# 若仍Fault:强制卸载再注册
undo slot 2
undo slot 3
wait 1分钟
slot 2
slot 3
2)升级 LSQ1GP24SC0 单板 Bootrom/CPLD(必须做)
V5 老版本经常是 板载 Bootrom 太旧,无法被 V5.2 6605P03 正常加载。操作(Console 下):
bash
运行
# 1. 下载对应板卡Bootrom/CPLD包(H3C网站:LSQ1GP24SC0-Bootrom-108+CPLD-125)
# 2. 上传到交换机flash
# 3. 升级(以Slot2为例)
upgrade bootrom slot 2 flash:/LSQ1GP24SC0_bootrom.bin
upgrade cpld slot 2 flash:/LSQ1GP24SC0_cpld.bin
# 两块都升
upgrade bootrom slot 3 flash:/LSQ1GP24SC0_bootrom.bin
upgrade cpld slot 3 flash:/LSQ1GP24SC0_cpld.bin
# 升级后重启整台
save
reboot
3)升级主机版本到 V5.2 6616P01+ 或 6624Pxx
6605P03 已知不兼容部分 LSQ1GP24SC0
6616P01 及以后修复了光板注册 / 驱动问题
升级步骤(简化):
bash
运行
# 1. 下载 S7506E-V5.2 6616P01 .bin
# 2. 上传
# 3. 设置启动
boot-loader file flash:/s7506e-v5.2-6616P01.bin slot all
save
reboot
4)电源 / 机框排查(两块同时 Fault 必查)
确认 双电源均正常、均在位、均绿灯
断电整机 5 分钟 → 彻底放电 → 重新上电(比 reboot 干净)
检查机框背板、槽位针脚无弯曲 / 氧化
5)如果仍 Fault:最小化测试
只插 一块 Fault 光板 + 一块主控 + 双电源
其他板全拔掉 → 上电看是否 Normal
正常 → 是整机功耗 / 冲突
仍 Fault → 这块光板硬件损坏(两块同时坏概率低)
四、结论与下一步
你当前版本 V5.2 6605P03 是主因:对 LSQ1GP24SC0 兼容性差。
两块同时 Fault → 不是单块硬件坏 → 优先软件 / 版本 / CPLD。
最快恢复路径:
整机断电 5 分钟 → 重新上电
升级 LSQ1GP24SC0 Bootrom+CPLD
主机版本升级到 6616P01+
再换槽测试
两块 LSQ1GP24SC0 光接口板同时故障,且一块电接口板完全正常,这个现象极大概率是由硬件兼容性或固件层面的故障导致的,而非简单的物理接触问题。
你已经做了插拔和换槽位的尝试,说明基础物理连接没问题。可以按照从软件到硬件的顺序,按以下步骤系统排查:
在继续操作前,请务必收集以下信息,这是后续判断的基础:
查看板卡详细状态:执行 display device 命令,确认两块故障板的具体注册状态。
检查系统日志:执行 display logbuffer 命令,在日志中搜索与这两块板卡相关的任何错误信息。
检查槽位供电:如果设备支持,使用 display power 检查故障槽位对应的电源模块输出是否正常。
在硬件有故障迹象的情况下,软件问题可能性较低,但仍是必须排除的一环。
取消接口配置:在故障板卡的接口视图下,执行 undo default 命令恢复出厂设置,排除配置冲突的可能。
检查版本适配性:LSQ1GP24SC0 型号较老,Release 6605P03 也是较早的版本。你需要确认此版本是否完整支持这块光接口板,否则可能出现兼容性问题。特别是,早期版本存在部分光口随机不UP的问题,版本过老也可能导致板卡无法被正常驱动。
重置整机配置:如果确认配置文件至关重要,作为最终手段,可执行 reset saved-configuration 后重启,测试是否为配置冲突。
如果以上步骤没有帮助,基本可以锁定为硬件问题。
清洁与固件:用橡皮擦拭板卡的金手指,并用毛刷清理背板槽位。如果有新版本,尝试升级整机(包括主控板)的BootROM版本,新固件可能包含对老硬件的修复。
隔离测试:在关机断电后,只保留主控板和一块故障板,移除所有其他板卡(包括那块正常的电口板),然后重新上电测试。
确认槽位兼容性:通过 display device 确认两块板卡所在的槽位是否有特殊的硬件限制。
极少数情况下,板卡会进入一种“假死”状态。在确保业务允许的前提下,可以尝试 power-supply on 和 power-supply off 命令对板卡进行冷重启。若无效,可尝试在BootWare菜单(通过 Ctrl+B 进入)中恢复一次出厂设置。
暂无评论
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论