【产品型号】
H3C S12500-X/F&S12500X/F/M-AF&S12500R& S12500G-AF系列交换机
H3C S10500&S7500E&S7600&S7600X&S7500X&S10500X&S7500E-X&S12500-XS&S12500-S系列交换机
H3C S9900&S9800系列交换机
【涉及版本】
产品型号 | 问题版本 |
S12500-X/S12500-F/S12500X-AF/S12500F-AF/S12500R/S12500G-AF系列 | 所有版本 |
S10500/S7500E/S7600/S7600X/S7500X/S10500X/S7500E-X/S12500-XS/S12500-S系列 | R7184及之后版本 |
S9900/S9800系列 | 所有版本 |
上述设备加载上述软件版本时,默认情况下,当设备检测到单板器件出现部分转发层面的硬件故障时,设备只发送TRAP信息,不会通过自动关闭端口或重启等方式修复故障,导致经过故障单板的流量长时间受影响。
【原因分析】
上述软件版本系统检测到部分硬件故障时默认采取的动作为warning,不会自动关闭端口或重启单板等方式修复故障。
【规避措施/解决方案】
1、在如下冗余组网场景,配置设备检测到故障时处理动作为isolate:设备检测到故障后会自动关闭端口、重启或隔离单板、禁止单板加载或给单板下电,从而尽量减小故障的影响。
场景一:在堆叠场景、上下行链路均为跨框聚合或者跨框ECMP转发;
场景二:其他非堆叠双机场景、上下行均有冗余备份链路。
在系统视图下配置当系统检测到硬件故障时自动采取的修复操作为isolate:
hardware-failure-detection board isolate
hardware-failure-detection chip isolate
hardware-failure-detection forwarding isolate
2、其他非冗余组网场景,配置处理动作为reset:检测到故障时,设备会自动重启器件、单板以尝试修复故障,从而避免长时间影响业务。
在系统视图下配置当系统检测到硬件故障时自动采取的修复操作为reset:
hardware-failure-detection board reset
hardware-failure-detection chip reset
hardware-failure-detection forwarding reset
3、如果要恢复成默认处理动作,命令如下:
hardware-failure-detection board warning
hardware-failure-detection chip warning
hardware-failure-detection forwarding warning
配置板卡芯片故障时候的处理动作就好了,告警就消失了
2、其他非冗余组网场景,配置处理动作为reset:检测到故障时,设备会自动重启器件、单板以尝试修复故障,从而避免长时间影响业务。
在系统视图下配置当系统检测到硬件故障时自动采取的修复操作为reset:
hardware-failure-detection board reset
hardware-failure-detection chip reset
hardware-failure-detection forwarding reset
3、如果要恢复成默认处理动作,命令如下:
hardware-failure-detection board warning
hardware-failure-detection chip warning
hardware-failure-detection forwarding warning
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论