【产品型号】
vBRAS 、vFW 、VSR 、vLNS 、vLB (不涉及vAC)
【涉及版本】
vBRAS: E0327L01(不含)之前所有版本
vLNS: E0327L01(不含)之前所有版本
VSR: R0327L01(不含)之前所有版本
vFW/vLB: E1166L01(不含)之前所有版本
【问题描述】
VNF设备堆叠组网,堆叠分裂再合并后,特定条件下会出现两框所有物理接口全部被MAD DOWN,造成业务中断。此时重启单框无法恢复,必须同时重启两框,堆叠重新竞选后接口状态才会恢复。
【触发条件】:
1)VNF堆叠设备配置了ARP MAD检测。
2)IRF Member ID大的成员堆叠优先级>= IRF Member ID小的成员堆叠优先级。如下图:MemberID为2的成员堆叠优先级为10,大于MemberID为1的成员,满足问题触发条件;反之则不会触发问题。
3)堆叠设备发生堆叠分裂,ARP MAD检测生效后,堆叠再合并。
【问题原因】
满足以上三个条件时,如果堆叠分裂,ARP MAD检测生效,此时MAD检测模块会将IRF Member ID号大的成员设备置为Recovery状态, 并MAD DOWN该成员设备上所有的接口,而IRF Member ID号小的成员设备正常工作,此时不影响业务。
当堆叠再合并时,按照堆叠优先级顺序选举堆叠成员Master。因为IRF Member ID大的成员设备优先级高,该设备会被选举为Master。而堆叠优先级低的成员设备会同步Master设备的Recovery状态,导致堆叠内所有成员设备的接口全部被MAD DOWN,进而导致业务中断。
【规避措施】
如果故障尚未发生,请尽快登录设备,输入命令“display irf”自检。如果发现IRF Member ID大的成员堆叠优先级>= IRF Member ID小的成员堆叠优先级,可通过命令“irf member member-id priority priority”命令调整优先级,使得IRF Member ID大的成员,其堆叠优先级<IRF Member ID小的成员堆叠优先级,并save配置,从而规避该问题。该操作不会影响业务。
若故障已发生,请同时重启所有堆叠成员设备来恢复业务。同时重启时,成员设备会重置当前Recovery的状态,从而接口MAD DOWN状态恢复。业务恢复后,请按照按上述规避手段修改堆叠成员优先级规避问题。
【解决方案】
各NFV产品如下正式版本已解决该问题,请根据现网实际情况升级各NFV产品彻底解决问题。因版本不断迭代更新,请联系新网络产品线确认最新版本用以升级。
产品型号 |
解决问题版本 |
VSR |
R0327L01 |
VFW/VLB |
E1166L01 |
vBRAS |
E0327L01 (E0325L02版本VBRAS可通过E0325L02H01热补丁修复) |
vLNS |
E0327L01 |
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作