问

5820V2 堆叠分裂，查看诊断日志，如何判断是什么原因导致堆叠分裂的？

堆叠

2019-11-07提问

1关注
1收藏，4702浏览

南山樵子

南山樵子零段

粉丝：2人关注：3人

问题描述：

猜想：

1.slot2电源掉电

logbuffer信息如下：

%@7764%Jul 22 03:35:55:403 2019 设备名称 DRVPLAT/4/DrvDebug: The port Forty1/0/51 can't receive irf pkt and has been changed to inactive status, please check.

%@7765%Jul 22 03:35:55:403 2019 设备名称 DRVMNT/3/ERRORCODE: ErrCode = 1866268676, IRF: STM Hello Check Fail.

%@7766%Jul 22 03:35:55:403 2019 设备名称 DRVPLAT/4/DrvDebug: The port Forty1/0/52 can't receive irf pkt, please check.

%@7767%Jul 22 03:35:55:825 2019 设备名称 DRVPLAT/4/DrvDebug: The port Forty1/0/51 has been changed to active status.

%@7768%Jul 22 03:36:02:709 2019 设备名称 STM/2/STM_LINK_STATUS_TIMEOUT: IRF port 1 is down because heartbeat timed out.

%@7769%Jul 22 03:36:02:884 2019 设备名称 STM/3/STM_LINK_STATUS_DOWN: IRF port 1 is down.

%@7770%Jul 22 03:36:02:926 2019 设备名称 DEV/3/BOARD_REMOVED: Board was removed from slot 2, type is S5820V2-52QF.

%@7771%Jul 22 03:36:02:935 2019 设备名称 LAGG/6/LAGG_INACTIVE_PHYSTATE: Member port FGE2/0/49 of aggregation group BAGG1 changed to the inactive state, because the physical state of the port is down.

%@7772%Jul 22 03:36:02:936 2019 设备名称 LAGG/6/LAGG_INACTIVE_PHYSTATE: Member port FGE2/0/50 of aggregation group BAGG1 changed to the inactive state, because the physical state of the port is down.

%@7773%Jul 22 03:38:30:115 2019 设备名称 CFGMAN/5/CFGMAN_CFGCHANGED: -EventIndex=5-CommandSource=snmp-COnfigSource=startup-COnfigDestination=running; Configuration is changed.

最佳答案

24号扣子

24号扣子九段

粉丝：53人关注：5人

重启的可能性比较多，仅从日志信息无法究其原因，建议收集对应诊断信息反馈400，其中有对应重启的堆栈信息，研发可基于对应信息进行分析重启原因。

3 个回答

按时间按赞数

ttzz

ttzz 九段

粉丝：13人关注：0人

心跳超时，链路down或者对端设备down

当IRF正常运行时，只有主设备上配置的MAD IP地址生效，从设备上配置的MAD IP地址不生效，BFD会话处于down状态；（使用display bfd session命令查看BFD会话的状态。如果Session State显示为Up，则表示激活状态；如果显示为Down，则表示处于down状态） · 当IRF分裂形成多个IRF时，不同IRF中主设备上配置的MAD IP地址均会生效，BFD会话被激活，此时会检测到多Active冲突。

ttzz 发表时间：2019-11-07 更多>>

看日志是1/0/51 和 1/0/52口同时can't receive irf pkt，所以不可能是链路down，很大可能就是设备掉电了

南山樵子发表时间：2019-11-07

回复南山樵子:

是的，只是列举可能性而已

ttzz 发表时间：2019-11-07

1.参考诊断日志如何准确定位呢？ 2.如果是堆叠线问题导致的堆叠分裂，mad把业务口自动shutdown，如果是bfd方式，那检测口的状态此时还是UP的吗？是不是还有一种现象，带外管理时通时不通，因为此时管理口地址冲突

南山樵子发表时间：2019-11-07

ttzz 发表时间：2019-11-07