客户现场采用Server 1---MSR3640---MSR3600---MSR3600-X1---Server 2组网方式,接口信息如图所示。
客户反馈现场由服务器server 2提供的视频业务受到影响,从server 1 ping server 2中间经过3台msr路由器设备产生丢包现象,于是指导现场部署流统确认问题原因。
1、客户反馈由server 2提供的视频业务无法正常提供服务,后续从server 1 长ping server 2产生丢包,于是迅速指导现场部署流量统计,确认丢包位置,明确问题所在。
流通部署:从server 1 到 server 2中间经过三个msr设备,在这三个路由器设备均部署流量统计,server 1到server 2指定ping 50个包。
流量统计配置: (以MSR3640设备配置为例,其他路由器设备配置相同)
acl advanced 3010
rule 0 permit icmp source 19.0.7.2 0 destination 19.25.7.10 0 //正向ping流量,指定icmp协议
rule 1 permit icmp source 19.25.7.10 0 destination 19.0.7.2 0 //反向ping流量,指定icmp协议
#
traffic classifier 1 operator and //创建类1,匹配规则ACL 3010
if-match acl 3010
#
traffic behavior 1 //创建流行为1,流行为为过滤动作允许
filter permit
#
qos policy 1 //创建策略1,指定类1采用流行为1
classifier 1 behavior 1
#
interface GigabitEthernet6/19 //出接口上应用QoS策略1,并指定双向应用
qos apply policy 1 inbound
qos apply policy 1 outbound
#
interface GigabitEthernet0/0 //入接口上应用QoS策略1,并指定双向应用
qos apply policy 1 inbound
qos apply policy 1 outbound
2、根据流统信息确认丢包位置 (从三个设备六个接口的流通信息得出丢包发生在server 1 ping server 2的反向流量转发过程中,MSR3600出接口G00到MSR3640入接口6/19之间。下面仅展示这两个接口的流统信息)
MSR3600设备:
Interface: GigabitEthernet0/0
Direction: Outbound //出方向
Policy: 1
Classifier: default-class
Matched : 233236 (Packets) 287724751 (Bytes)
5-minute statistics:
Forwarded: 682/6730878 (pps/bps)
Dropped : 59/585675 (pps/bps)
Operator: AND
Rule(s) :
If-match any
Behavior: be
-none-
Classifier: 1
Matched : 50 (Packets) 3700 (Bytes) //50个包,未发生丢包
5-minute statistics:
Forwarded: 0/94 (pps/bps)
Dropped : 0/3 (pps/bps)
Operator: AND
Rule(s) :
If-match acl 3010
Behavior: 1
Filter enable: Permit
MSR3640设备:
Interface: GigabitEthernet6/19
Direction: Inbound //入方向
Policy: 1
Classifier: default-class
Matched : 212151 (Packets) 261158544 (Bytes)
5-minute statistics:
Forwarded: 506/4979528 (pps/bps)
Dropped : 0/0 (pps/bps)
Operator: AND
Rule(s) :
If-match any
Behavior: be
-none-
Classifier: 1
Matched : 48 (Packets) 3552 (Bytes) //48个包,即从MSR3600的G0/0接口发出50个包,而MSR3640的G6/19仅收到48个包,丢包数量为2
5-minute statistics:
Forwarded: 0/78 (pps/bps)
Dropped : 0/0 (pps/bps)
Operator: AND
Rule(s) :
If-match acl 3010
Behavior: 1
Filter enable: Permit
指导客户reset counters interface命令清空流量统计信息,再次指定ping50个包,收集流统信息结果一致,即2个丢包发生在MSR3600的G0/0接口及MSR3640的6/19接口之间。
3、丢包发生在两设备接口之间,后续查看涉及接口并不存在CRC错包及其他错误信息,现场更换中间链路口问题依旧。
4、再次检查设备配置,发现相关接口有qos car限速配置。取消car配置测试,丢包现象消失,因此丢包为接口的qos car限速配置导致。
MSR3600的G0/0接口限速配置:
interface GigabitEthernet0/0
port link-mode route
ip address 19.0.10.149 255.255.255.252
packet-filter 3800 outbound
qos apply policy 1 inbound
qos apply policy 1 outbound
qos car outbound acl 3170 cir 20000 cbs 128000 ebs 0 green pass red discard yellow pass
查看接口ca限速情况,存在很多Red packets
查看相关接口流量,可以部分显示,最近5min钟平均流量 input :10 M(byte) output:3.9M(byte)
而限速配置为:
qoscar outbound acl 3170 cir 20000 cbs 128000 ebs 0 green pass red discard yellow pass
此处限速cir 为小b,bit。(20000/8/1000=2.5M),因此接口平均流量超过限速,导致报文被丢弃,从而导致red队列丢包。
取消car配置测试,丢包现象消失,因此丢包为接口的qos car限速配置导致 。
后续调整限速策略,合理配置后问题得到解决。
调整限速策略,合理配置后问题解决。
在排查丢包问题时我们应该正确部署流统,确认丢包位置,排查相关设备与接口情况,对于限速的配置需额外注意,当需要配置car限速时也需要合理规划部署,避免产生业务丢包的情况。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作