Print

某据点Portal认证计费报文发送延迟高导致认证慢问题处理经验案例

2019-11-18 发表

组网及说明

AC与第三方portal服务器对接实现portal认证,本地转发,下发授权CAR

问题描述

无线终端进行portal认证,认证成功后经常需要等一段时间后才可以上网,时间2-5min不等,经服务器侧初步判断为AC设备发送计费请求报文延迟高,相比于认证请求报文会延迟2-5min左右才发送,而出口设备联动要求完成计费报文交互才可放行认证终端上网 ,从而出现认证通过了但需要等一段时间才能上网的问题。 

过程分析

通过在服务器侧和AC端口镜像抓包分析看,终端认证通过后,radius报文交互中access-request与access-accept完成后,AC过了2min多钟才发送计费请求报文accounting-request。


检查AC配置并未发现异常,收集AC日志,发现日志中有QOS下发限速失败报错:

%Oct 22 15:01:09:403 2019 WX5540H QOS/4/QOS_AUTHCAR_APPLYUSER_FAIL: -MAC=XXXX-XXXX-033a-IP=X.X.17.16-SVLAN=516-Port=WLAN-BSS1/0/29297; Failed to apply the authorized CAR to the user.

现场是本地转发,有限速策略下发,策略下发到AC是正常,但本地转发情况下AC需要将策略下发到AP,此时出现问题。AC下发策略到AP是通过opflow下发CAR策略,由于openflow响应慢,导致portal计费请求发送慢,进一步排查openflow问题。

尝试在AC与AP之间抓包,分析现网抓包,openflow由AP发往AC的大包AC收不到,导致AP上openflow使用的TCP连接不断超时重连,(TCP载荷1448字节)。openflow的TCP载荷加上ETH头14字节,加上IP头20字节,再加上TCP头20字节共1502字节。尝试从AP ping 1472字节报文不通,怀疑链路中存在大包不通问题。

对比测试,将AP直连AC ping大包测试没问题,因此断定中间链路问题。


解决方法

协调第三方厂家排查核心交换机及中间链路问题,后修改核心交换机MTU值后问题解决