关于H3C 12500系列交换机单板在下行端口流量拥塞引起其它下行端口转发丢包的问题公告
【产品型号】
H3C S12500 系列交换机XP16L、XP20R、XP40R、XP48L、XLP16R以及CP4R单板
【涉及版本】
所有版本
【问题描述】
1. 问题出现条件:
当满足以下条件时,可能导致问题产生:
(1) 设备上行端口使用问题涉及单板作为流量入口;
(2) 流量下行出端口存在拥塞;
当满足以下条件是,会增加问题产生的风险:
(1)流量下行端口为GE口、端口配置限速策略、为多个流量入端口共用的出端口或者报文从10GE端口镜像至GE端口;
(2)拥塞报文字节为小字节报文;
(3)该流量模型中,存在攻击流量或者其他容易造成出端口拥塞的流量;
例如:利用黑洞路由将从XP16单板某FAP芯片进入的小字节攻击流量引向某个与设备GE口相连的黑洞设备进行处理,导致了该GE口拥塞。
2. 问题现象:
与问题涉及单板属于同一转发芯片(FAP芯片)的流量转发到其它下行口存在报文转发丢包,相关业务受影响。
故障时查看转发芯片的IQM(入队列管理)存在大量丢包:
0x1927D287 422040199 | 0x0000156C | IQM: Enqueue Packet Counter
0x1927D287 422040199 | 0x00001570 | IQM: Dequeue Packet Counter
0x5ED0B0C8 1590735048 | 0x00001574 | IQM: Total Discarded Packet Counter
IQM丢包可以通过以下命令查询:
Comware V7版本Probe视图:
[H3C-probe]display hardware internal forward counter slot X
Comware V5版本Hidecmd视图:
[H3C-hidecmd]_display driver forward counter slot X
注:
Comware V7版本,是指S12500的71XXPxx系列版本和73XXPxx系列版本。
Comware V5版本,是指S12500的17XXPxx系列版本和18XXPxx系列版本。
3. 流量模型示意图:
红色流量为典型高速率端口(XP16)转发至低速率端口(GP48)流量模型,当该流量在出方向(GP48)端口持续拥塞时,会导致XP16单板Buffer被占满从而影响其他经过XP16单板FAP转发的流量(黑色流量)
【原因分析】
故障原因为,现有的问题涉及单板Buffer缓存机制决定了在流量出端口存在持续拥塞的情况下,会导致入方向Buffer被大量占用,该转发芯片的其它端口不能获得足够的Buffer,从而引起报文转发丢包。
涉及该问题的单板Buffer缓存机制与其他不涉及该问题单板Buffer缓存机制不同,单板入方向Buffer缓存机制为数据中心场景下大流量业务的瞬时突发提供了保障,减少了业务丢包的概率。涉及该问题的单板并不存在质量问题。
【规避措施/解决方案】
请办事处对重点价值客户执行如下策略:
(1) 对符合问题条件的组网(问题涉及单板作为业务流量入口,业务流量出口通常为GE端口或者配置了限速在GE及以下)进行评估,关注出端口是否存在持续拥塞的情况。
(2) 对于存在风险的组网应用,建议优化单板的Buffer配置参数,该命令不需要重启设备或者板卡,具体命令如下:
Comware V7版本,系统视图:
buffer ingress slot slot-number packet total-shared 0
buffer apply
Comware V5版本,系统视图:
buffer-manage ingress slot slot-number share-size 0
(3) 如果网络出现多个端口出方向同时持续拥塞,使用命令行优化Buffer参数后无法完全解决问题,请及时联系二线,在版本允许及经过评估的基础上,可以采取进一步的规避措施。
(4) 使用命令行对Buffer进行优化后对现网正常业务没有影响,但是会降低单板对突发流量的缓存能力。
【KMS号】
该公告已归档到知识案例库,归档ID号为XXXX。
【参考资料】
无。
如有问题,请联系杭州华三通信技术有限公司服务热线:4008100504。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作