某金融局点使用两台SR6608作为汇聚路由器,和上行核心路由器运行OSPF协议交互路由。下行有30多个分支,每个分支有两台MP交换机,SR6608与MP交换机运行RIP协议交互路由。在两台SR66上配置了OSPF和RIP协议路由互引,保证路由互通。拓扑图如下图所示:
客户反馈故障现象如下:
在MP交换机上查看,其从SR6608学习的路由(如100.224.1.0/24)在路由表中有时都有,有时有一项,有时都没有(即到SR66-1和SR66-2都没有了)。这导致下行网点到上行服务器间有间歇丢包并严重影响业务。
收集现场路由表、debug等信息,我们发现:
1、在SR66-1和SR66-2上看去往100.224.1.0/24的OSPF路由,发现该OSPF路由均稳定存在,无震荡现象。看来,这个问题和设备OSPF模块无关系。
2、每台SR6608设备,从OSPF进程引入的RIP路由多达1600余条。由于客户有30余个分支,所以设备要将RIP路由从30多个接口发出给MP设备。
3、在SR66-2上开启debug rip 1 send,几分钟后停止,发现SR66-2并没有发送100.224.1.0/24的路由给MP交换机,但能够发送另外一部分RIP路由给MP交换机。仔细查看,发现路由条目较小的RIP路由(如100.1.1.0/24)发送都是正常的,但路由条目较大的RIP路由(100.224.1.0/24)发送就不稳定。
4、在SR66-2上开启debug rip 1 receive,几分钟后停止,发现SR66-2收到了从MP交换机发来的100.224.1.0/24 RIP路由,且Mertic为16。
*Aug 29 12:45:35:940 2014 GSJCWA02-C1 RM/6/RMDEBUG: AFI 2, dest 100.224.1.0/255.255.255.0, nexthop 0.0.0.0, cost 16, tag 0
我们再来了解一下SR6608路由器RIP模块的相关机制:
1、设备每30秒发送一次自身的RIP路由表,且每20毫秒最多发送3个RIP报文,每个报文最多携带25条RIP路由。
2、设备发送RIP路由时,首先发送路由条目较小的RIP路由,再发送路由条目较大的RIP路由。
3、设备RIP模块的处理机制是收发报文并行处理。
从上述现象机制、设备信息来看,基本上可以得出问题结论:SR6608发送RIP路由的速率不够,导致部分路由条目较大的路由,无法发送给MP交换机。
1、 通过配置,加快设备发送RIP路由的速率。建议在RIP视图下配置[Sysname-rip-1] output-delay 15 count 10命令,使设备每15毫秒发送10个RIP报文(该值仅为参考,实际配置值需根据现场情况做适当调整)。
2、 由于问题根本原因是RIP路由过多(1600余条),且需要发送RIP报文的接口过多(30余个)。建议在RIP引入OSPF路由时,做进一步过滤,减少RIP路由条目,如能减少RIP报文发送的接口数更佳。
3、 由于SR66 RIP模块的处理机制是收发报文并行处理。如收到大量邻居发来的路由cost为16的报文,也会对发送路由产生不利影响。建议将其RIP邻居(MP设备等)的毒性逆转功能关闭,保留水平分割功能,这样SR66发给RIP邻居的路由,对方就不会发送回来。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作