现场设备m-lag+evpn组网,虚机0050-5696-4d0c在1月30日出现迁移(以下图示为例,从LEAF A迁移至LEAF B下,后续又迁移回LEAF A),此后出现部分访问虚机0050-5696-4d0c的二层流量不通问题,通过在对应vsi内reset l2vpn mac-address恢复:
1. 通过对故障时相关交换机上的信息排查,发现当虚机从LEAF B迁移回LEAF A后,在M-LAG的两台LEAF B设备上,对应虚机的mac依旧存在于BAGG35口下,且状态为Dynamic表示该mac通过接口动态学习,此表项情况和实际情况不符,因此经LEAF B转发访问该mac的二层流量都将被错误地转发至BAGG35,导致不通:
===============display l2vpn mac-address ===============
MAC Address State VSI Name Link ID/Name Aging
1-1-1 Dynamic SDN_VSI_2104 BAGG35 Aging
通过display bgp l2vpn evpn看到1-1-1对应地址1.1.1.1的路由已经正常更新到了tunnel 6发出,说明LEAF B有从远端接收到对应的EVPN路由
1.1.1.1/32 BGP 255 0 10.10.10.10 Vsi10001
Tunnel6
Tunnel source 10.10.10.1, destination 10.10.10.10
Tunnel protocol/transport UDP_VXLAN/IP
2. 进一步排查此错误l2vpn mac-address表项生成的原因,通过交换机上l2vpn mac-address迁移的记录发现,该mac曾经在LEAF B进行过2次迁移。如下,display l2vpn mac-address mac-move会记录同一个mac在两个口迁移的最后一次记录和次数。可看到在BAGG35 srv2104和Tunnel6之间存在过2次迁移,即第一次迁移是从BAGG35 srv2104迁移至Tunnel6,最后一次是从Tunnel6迁移至BAGG35 srv2104。
MAC address : 1-1-1 VSI name : SDN_VSI_2104
Current port: BAGG35 srv2104 Source port: Tunnel6
Last time : 2026-01-30 01:40:00 Move count : 2
3. 现场在故障后通过reset l2vpn mac-address恢复,结合现场交换机设备上的漂移记录以及实际故障现象,可确认故障为早期版本的已知问题导致。参考之前实验室模拟此类虚机迁移复现的故障情况,其具体流程如下,其中过程(1)→(2)会造成l2vpn mac从BAGG35 srv2104迁移至Tunnel6的记录;过程(2)→(3)会造成Tunnel6迁移至BAGG35 srv2104的迁移记录:
(1)虚机在LEAF B上线,且LEAF B是M-LAG组网,如果虚机发出的报文先经过LEAF B-2学下MAC,LEAF B-2记录DL(本地学习)类型MAC,并同步给LEAF B-1下发DR((即mlag之间DR口同步)类型MAC,如果此时正好报文从LEAF B-1进来,LEAF B-2同步过来的DR MAC还未下发完成,此时LEAF B-1会同时共存本地学到的DL类型MAC和LEAF B-2同步过来的DR类型MAC。注:如果已下发完成DR类型MAC,此时如果报文从本地口进来不会再下发DL类型MAC,就不存在共存的情况。
(2)虚机迁移到LEAF A上线,MAC从远端LEAF A通过EVPN路由同步到LEAF B设备。
(3)虚机迁回到LEAF B上线,LEAF B-1设备EVPN模块由于同时存在DL类型和DR类型的MAC,此时DL类型激活发布路由至远端LEAF A,DR类型由于判断DL类型存在,置为不激活。远端LEAF A设备收到LEAF B-1发布的路由,触发迁移,发布路由撤销。LEAF B-1收到LEAF A的evpn路由撤销消息,误将DR类型激活,此时DL和DR均是激活状态
(4)虚机又迁至LEAF A上线,MAC又从LEAF B设备迁移至远端LEAF A,远端LEAF A发布路由至LEAF B-1设备,DL置为不激活状态,但未处理DR类型状态,此时由于DR还是激活状态,BGP同步过来的MAC无法下发,导致MAC往迁移隧道失败,没有产生指向隧道的MAC,触发问题,导致display l2vpn mac-address看mac地址依旧残留在BAGG35上。
4. 综合以上,此问题系交换机老版本已知问题导致的l2vpn mac地址残留问题,建议升级彻底解决。
1. 临时规避方案:如已触发问题可手动reset l2vpn mac-address重置对应vsi内动态学习的mac地址恢复。
2. 彻底解决方案:交换机升级到R8336P06解决。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作