设备对于的版本有以下的影响:
该版本下作为汇聚设备收到EVPN2类路由后会转发至其他交换机完成2类 EVPN路由自动学习过程,
因2类路由有带标签和不带标签之分,其判断机制存在缺陷,造成汇聚设备组包错误,导致汇聚设备发出的bgp消息是无法解析的。
进而造成和下联设备的bgp邻居震荡,进而导致断网现象。
EVPN组网,且网关(R2713H27之前版本)上开启代答功能,并伴有大量arp迁移且满足特定时序才能触发这个问题?
请问是否有这方面的文档说明?谢谢
(0)
最佳答案
ac学上来的arp会转化成二类路由,arp代答表项也会生成二类路由。这两种路由都会上报bgp模块,但是只要有arp表项的时候代答表项的二类路由是不会上报的,arp生成的二类路由优先级高。路由消息上报bgp之后会由bgp模块进行优选。
Bgp优选之后会发送bgp update消息出去,然后进入15s的抑制状态(相同的路由不会连续发送多次update)。
由于现场配置了L3VNI,Arp转化来的二类路由lable2字段都是有效的,里面填写的就是L3vin的值。
代答表项生成的二类路由lable2字段是无效的不携带L3vni的值。
两种路由上报spine设备之后上送路由管理模块有先有后。只有在arp表项消失之后代答表项的二类路由才可能上报(要么是arp表项20分钟老化了,代答老化时间是25分钟;要么是arp表项迁移走了)。
如果先上报上去的不带lable2字段的路由并发送update出去了,进入抑制阶段。然后又更新上去一个有lable2字段的update,spine进行路由更新组包的时候会拿之前上报上来带lable2字段的情况进行组包,而之前上报上来的lable2字段是空的。后上报上来的路由带lable2的值,那这个位置就会被充为空。
恰巧这个时候(15s抑制器件)有设备向我们这台设备发来了refresh消息,我们就会把这个lable2为空的bgp消息发到对端设备,对端设备会按照有lable2字段解析,但是实际过来的消息lable2字段是空的,就会解析出错,造成bgp震荡。
什么情况下容易出这个问题:1、虚机来回迁移,涉及到arp表项和代答表项的删除和生成。2、某个bgp邻居震荡也会导致arp和代答表项的删除和添加。一旦在这个过程中出现了上面提到特定时序,就会触发这个问题。
【规避手段】这个问题只要关掉代答表项,所有上报的二类路由都携带lable2字段,就不会有这个问题了。
【解决手段】升级R2713H27(包含)及之后的版本补丁。
· 问题现象:BGP邻居震荡。
· 问题产生条件:环境有大量ARP,在ARP迁移期间,更改EVPN/BGP配置触发BGP自动刷新路由时极低概率出现。
· 说明:无。
(0)
感谢!
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
感谢!