sr8808告警
(1)
最佳答案
参考12500的故障处理步骤:
设备的转发通道自动检测功能使能后(默认使能),各接口板之间会周期性的发送测试报文,检测各个接口板转发芯片的转发业务是否正常。
[Sysname]forward-path check enable
如设备转发异常,设备会不断打印Forwarding fault、Board fault等提示信息,如:
%May 12 11:51:30:664 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: -Slot=12; Forwarding fault: slot 18 to slot 12
%May 12 11:51:30:664 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: -Slot=14; Forwarding fault: slot 18 to slot 14
%May 12 11:51:30:665 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: -Slot=13; Forwarding fault: slot 18 to slot 13
%May 12 11:51:30:665 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: -Slot=16; Forwarding fault: slot 18 to slot 16
%May 12 11:51:31:494 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: Board fault: chassis 0 slot 18,please check it
%May 12 11:51:31:702 2013 SH-B15A-0201-P11-H12518-LC-01 DIAG/3/ERROR: Board fault: chassis 0 slot 18,please check it
S12500设备单板类型有主控板、接口板、网板,其中接口板与网板负责业务流量转发,流量在多块网板之间负载分担,而主控板仅负责控制管理,不参与业务流量转发。
· 如果多块接口板之间都有Forwarding fault打印,那么交换网板故障可能性大,需要进一步通过上述逐块隔离网板的方式来确认是不是哪块网板故障引起。以S12508为例说明网板隔离步骤,其中10~18槽位为网板:
a. 隔离10槽位网板,隔离后等待一段时间,观察故障是否消失。
[Sysname]board-offline slot 10
Caution: This command is only for diagnostic purpose which will cause board normal service unusable. Continue? [Y/N]:y
Config successfully
b. 取消10槽位网板隔离,待网板重启Normal后,隔离11槽位网板并观察故障是否消失。
[Sysname]undo board-offline slot 10
This command will reboot the specified board. Continue? [Y/N]:y
Config successfully
c. 按照上面的方法,依次隔离12~18槽位网板,直到所有网板隔离确认一遍。
· 如果Forwarding fault打印都是某一块接口板到其他多块接口板的转发故障,则该接口板故障的可能性较大;当然也不排除其他单板故障的可能性,比如有时候某块交换网板故障也可能导致只打印到某块接口板故障。
建议先逐块隔离网板,观察网板隔离后故障是否消失(网板隔离后不再参与流量转发;网板隔离动作不会引起丢包)。如果所有网板隔离一遍后故障仍存在,那么应为接口板故障导致,建议把设备接口板上的业务切走后通过隔离或更换接口板的方式进一步确认。
当配置了硬件在线诊断和故障保护功能(hardware-failure-detection)后,设备会针对器件、单板和转发三种类型的硬件故障进行在线检测,并对检测到的故障自动执行相应的修复操作。
您可以自行配置系统可自动采取的修复操作,包括:
· off:检测到故障时,交换机不进行任何操作
· warning:检测到故障时,交换机只进行告警,不执行修复故障的操作(缺省情况)
· reset:检测到故障时,交换机会自动重启单板以尝试修复故障
· isolate:检测到故障时,交换机会自动执行关闭端口、单板隔离、禁止单板加载、单板下电操作以减小故障的影响
在业务存在备份链路时,建议将设备配置为isolate级别,以便出现故障时能够自动检测切换,快速恢复业务,配置如下:
[Sysname]hardware-failure-detection chip isolate
Config successfully
[Sysname]hardware-failure-detection board isolate
Config successfully
[Sysname]hardware-failure-detection forwarding isolate
Config successfully
其中chip/board/forwarding描述如下:
· chip:对器件故障进行在线检测
· board:对单板故障进行在线检测
· forwarding:对转发层面的故障进行在线检测
通过下述命令可以查看设备当前的硬件故障检测和修复信息。
<Sysname>display hardware-failure-detection
Current level:
chip : warning
board : warning
forwarding : warning
---------------------Chassis 1, Slot 0 executed records:-------------------
There is no record.
---------------------Chassis 1, Slot 0 trapped records:--------------------
There is no record.
命令 | 说明 |
board-offline | 从系统中隔离指定单板 |
display hardware-failure-detection | 显示交换机的硬件故障检测和修复信息,包括各种故障对应的修复操作,以及系统中每个单板最近十次故障修复的历史信息 |
forward-path check enable | 使能转发通道自动检测功能。用于检测设备中的数据转发通道是否正常 |
hardware-failure-detection | 配置硬件故障在线检测和故障发生时自动采取的操作,以便出现硬件故障时能够自动检测、快速恢复业务 |
(1)
您好,请知:
DIAG/3/ERROR: -Slot=0; Forwarding fault: slot 2 to slot 0
槽位2和槽位0或板卡有问题。
dis device检查下槽位和板卡的状态是否正常。 如果状态为fault,是故障;如果是absent,是槽位不在位。
如果是fault,建议收集产品型号、序列号、诊断信息文件反馈400
(0)
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论