Print

某局点S5560X-EI几乎所有端口流量被打满问题案例

2020-02-28发表

组网及说明

/

问题描述

现场两台S5560X-EI两台堆叠作为接入设备,核心是S7500E,客户反馈只有该接入设备下的服务器业务卡顿。

查看该接入设备发现很多端口出方向带宽都打满了:

 

过程分析

查看input流量看到,只有一个业务上行口ten2/0/25inbound方向有9%的带宽,还有个是irf端口1/0/28口有9%的带宽,这两个口都是10G口,所以9%就是千兆端口的90%+。因此怀疑是ten2/0/25上行口收到的流量全部单播泛红了:

通过现场随意插一个空闲接口放通所有vlan直接接PC抓包发现,确实抓到了大量单播泛洪流量,如下:

 

设备查看该目的mac发现软件表上有:

===============display mac-address=============== 

 MAC Address      VLAN ID    State            Port/NickName            Aging

04d7-a544-ad98   1041       Learned          GE1/0/3                  Y

 

但是查看底层表项发现只有slot 1有,slot 2没有:

 

因为流量都是从ten2/0/25口进来的,而且slot 2底层mac表,所以当做未知单播泛洪了。

设备学习mac有两个途径:1是流量触发芯片学习。 2是软件定时同步到每个芯片(120S)。

 

经确认现场R1110P06老版本还不支持定时同步mac地址功能,现场设备又配置了本地优先转发,导致服务器上行的流量会优先从Slot1上转发,所以slot2上学不到服务器的mac地址,导致从slot2进来的单播报文,按照未知单播处理而泛洪.

解决方法

规避方法:

1.g1/0/3口的服务器发出的流量部分会哈希到slot 2去,触发芯片学习。现场配置后成功学习到mac,泛洪情况立刻消失了.

2.5560X的上行由聚合改为单链路或者5560X与服务器相连单端口也改成聚合口 (上下行都是聚合才是正常的负载分担组网)

解决方法:

升级R1119P12及以后版本彻底解决。