一、 组网:
二、 问题描述:
两台路由器设备建立直连的EBGP邻居,链路状态良好,peer关系可以正常达到established状态,但在AS-100的路由器上配置了一些路由引入BGP后 发现邻居down。
观察接口没有错报,用display bgp peer 命令查看后发现邻居始终处于ACTIVE状态:
[sr6602]display bgp peer
BGP local router ID : 1.1.1.2
Local AS number : 65130
Total number of peers : 1 Peers in established state : 0
Peer AS MsgRcvd MsgSent OutQ PrefRcv Up/Down State
10.10.2.1 4809 0 0 0 0 00:02:21 Active
将引入路由撤销,reset BGP 进程,peer 又可以重新建立。
三、 过程分析:
遇到上述的情况 我们首先打开debug信息查看bgp的相关事件和报文可以看到如下信息:
[sr6602]
*Jul 4 09:48:50:153 2011 sr6602 RM/6/RMDEBUG:
BGP_TIMER: CR Timer Expired for Peer 10.10.2.1
*Jul 4 09:48:50:154 2011 sr6602 RM/6/RMDEBUG:
BGP.: 10.10.2.1 Current event is CRTimerExpired.
*Jul 4 09:48:50:154 2011 sr6602 RM/6/RMDEBUG:
BGP.: 10.10.2.1 State is changed from ACTIVE to CONNECT.
*Jul 4 09:48:50:154 2011 sr6602 RM/6/RMDEBUG:
BGP.: 10.10.2.1 Current event is TransConnOpenFailed.
*Jul 4 09:48:50:154 2011 sr6602 RM/6/RMDEBUG:
BGP.: 10.10.2.1 State is changed from CONNECT to ACTIVE.
我们可以看到当前事件为发送connect open 报文失败
经过以上的分析,我们基本可以得出,bgp peer 在引入路由后进入Active 状态,debug 中发现open报文发送失败信息。这个时候我们应当查看对端的peer上是否对于接收的BGP 路由前缀数目设置有上限阈值。
如果对端peer配置为:
peer { group-name | ip-address } route-limit prefix-number [ percentage-value ]
这是可以确认问题现象为对端设定路由接收阈值导致邻居无法建立
事实上,SR66上类似的配置有三种:
peer { group-name | ip-address } route-limit prefix-number [ percentage-value ]
peer { group-name | ip-address } route-limit prefix-number alert-only [ percentage-value ]
peer { group-name | ip-address } route-limit prefix-number reconnect reconnect-time [ percentage-value ]
配置1 会在路由接收数目达到上限阈值时主动断开与peer的bgp连接
配置2 会在路由接收数目达到上限阈值时仅发送告警信息但不会断开连接
配置3 会在路由接收数目达到上限阈值时断开连接,并重新建立
四、 解决方法:
提高阈值数值或者过滤、聚合发布给对端Peer的路由条目数量
五、 注意事项:
在与运营商网络进行EBGP对接时往往会遇到这个现象,因为运营商的路由器为避免处理过多路由条目 一般都会限制接收的BGP路由条目上限。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作