Print

NFV产品特定条件下堆叠分裂再合并后出现物理接口全部MAD DOWN问题的技术公告

2018-03-21 发表

【产品型号】

vBRAS vFW VSR vLNS vLB  (不涉及vAC)

【涉及版本】

vBRAS: E0327L01(不含)之前所有版本

vLNS: E0327L01(不含)之前所有版本

VSR: R0327L01(不含)之前所有版本

vFW/vLB: E1166L01(不含)之前所有版本

【问题描述】

VNF设备堆叠组网,堆叠分裂再合并后,特定条件下会出现两框所有物理接口全部被MAD DOWN,造成业务中断。此时重启单框无法恢复,必须同时重启两框,堆叠重新竞选后接口状态才会恢复。


【触发条件】:

1)VNF堆叠设备配置了ARP MAD检测。

2)IRF Member ID大的成员堆叠优先级>= IRF Member ID小的成员堆叠优先级。如下图:MemberID2的成员堆叠优先级为10,大于MemberID1的成员,满足问题触发条件;反之则不会触发问题。

文本框: <Sysname> display irf
MemberID  Role     Priority    CPU-Mac           Description
1        Slave       1           00e0-fcbe-3102    F1Num001
*+2        Master      10          00e0-fcb1-ade2    F1Num002

3)堆叠设备发生堆叠分裂,ARP MAD检测生效后,堆叠再合并。

问题原因

满足以上三个条件时,如果堆叠分裂,ARP MAD检测生效,此时MAD检测模块会将IRF Member ID号大的成员设备置为Recovery状态, MAD DOWN该成员设备上所有的接口,而IRF Member ID号小的成员设备正常工作,此时不影响业务。

当堆叠再合并时,按照堆叠优先级顺序选举堆叠成员Master。因为IRF Member ID大的成员设备优先级高,该设备会被选举为Master。而堆叠优先级低的成员设备会同步Master设备的Recovery状态,导致堆叠内所有成员设备的接口全部被MAD DOWN,进而导致业务中断。


规避措施

如果故障尚未发生,请尽快登录设备,输入命令“display irf”自检。如果发现IRF Member ID大的成员堆叠优先级>= IRF Member ID小的成员堆叠优先级,可通过命令irf member member-id priority priority命令调整优先级,使得IRF Member ID大的成员,其堆叠优先级<IRF Member ID小的成员堆叠优先级,并save配置,从而规避该问题。该操作不会影响业务。

若故障已发生,请同时重启所有堆叠成员设备来恢复业务。同时重启时,成员设备会重置当前Recovery的状态,从而接口MAD DOWN状态恢复。业务恢复后,请按照按上述规避手段修改堆叠成员优先级规避问题。

解决方案   

NFV产品如下正式版本已解决该问题,请根据现网实际情况升级各NFV产品彻底解决问题。因版本不断迭代更新,请联系新网络产品线确认最新版本用以升级。

产品型号

解决问题版本

VSR

R0327L01

VFW/VLB

E1166L01

vBRAS

E0327L01

E0325L02版本VBRAS可通过E0325L02H01热补丁修复)

vLNS

E0327L01