某客户网络拓扑大致如图所示,CR16K设备连接用户省公司的内网,SR88X连接地市设备的内网,当从省公司CR16K设备ping直连运营商的对端SR88X设备的端口的时候,丢包严重;另外,在SR88X设备上使用2号槽位的地址ping与88X互连设备的地址的时候,延时比较大,并且从其他设备上telnet SR88X设备2槽位的地址的话,存在卡顿的现象;但是SR88X设备其他槽位的地址和CR16K设备ping其他地址都不丢包。
由于现场存在2号槽位存在telnet卡顿和ping直连延迟大并且丢包的情况,于是收集了一下2号槽位CPU的使用情况:
[SR8804-X-S-02-probe]moni thre dum sl 2
251 processes; 273 threads
Thread states: 6 running, 267 sleeping, 0 stopped, 0 zombie
CPU0 states: 0.00% idle, 3.97% user, 79.81% kernel, 16.21% interrupt
CPU1 states: 100.00% idle, 0.00% user, 0.00% kernel, 0.00% interrupt
CPU2 states: 100.00% idle, 0.00% user, 0.00% kernel, 0.00% interrupt
从收集过来的的信息来看,CPU0已经使用了100%,会存在telnet卡顿和ping丢包和延迟大的现象,为了明确是什么报文在上送CPU,收集了如下信息:
[SR8804-X-S-02-probe]debug rxtx soft show 2
ID Type RcvPps Rcv_All DisPkt_All Pps Dyn Swi Hash ACLmax
0 ROOT 0 8311122 0 1000 S On SMAC 0
1 ISIS 0 12 0 1200 D On SMAC 8
2 ESIS 0 0 0 100 S On SMAC 8
3 CLNP 0 0 0 100 S On SMAC 8
4 VRRP 0 0 0 300 S On SMAC 8
5 UNKNOWN_IPV4MC 0 0 0 100 S On SMAC 8
6 UNKNOWN_IPV6MC 0 0 0 100 S On SMAC 8
7 IPV4_MC_RIP 0 0 0 150 S On SMAC 8
8 IPV4_BC_RIP 0 0 0 150 S On SMAC 8
9 MCAST_NTP 0 0 0 100 S On SMAC 8
10 BCAST_NTP 0 0 0 100 S On SMAC 8
11 IPV4_MC_OSPF_5 476 119805358 0 1100 S On SMAC 8
这个信息可以看到OSPF报文在不停的上从CPU0,导致该问题的发生,于是现场收集了OSPF信息,发现这些报文都是从CR16K设备的G1/0/1发送过来的,解析出来的OSPF报文也为畸形报文;为了明确是否是OSPF问题导致telnet卡顿和ping直连延迟大,并且丢包的情况,现场配置了CR16K设备侧与SR88X互连接口为OSPF静默接口,此时发现telnet正常了,但是CR16K和SR88X设备过运营商直连ping还是存在严重的丢包,怀疑该现象与我们设备没有很大的关系;与此同时,发现SR88X设备侧G2/0/1接口的入方向存在大量的错包,并且观察到错包增长的速度非常快,一般情况下,连接运营商接口侧入方向存在错包多为运营商侧的问题,另外,现场为了排除接口故障的因素,也对CR16K侧和SR88X侧连接运营商的接口进行更换,发现现象也一样,此时联系运营商侧进行排查,运营商专线侧更换接口后,直连ping不存在丢包的问题,此时,取消CR16K设备侧与SR88X互连接口为OSPF静默接口后,发现从其他设备telnet SR88X设备2号槽位的地址正常了,并且ping也不存在延迟大的问题了。所以,该问题最终为运营商链路问题导致的。
1、运营商侧专线更换接口后正常,排除我司设备的问题,对运营商专线侧进行排查。
设备存在ping严重丢包的情况的时候,建议先查看接口下的相关信息,display interface查看下接口下是否存在错包之类的,如果存在错包,并且有增长,建议先排除掉该因素。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作