AC与第三方portal服务器对接实现portal认证,本地转发,下发授权CAR
无线终端进行portal认证,认证成功后经常需要等一段时间后才可以上网,时间2-5min不等,经服务器侧初步判断为AC设备发送计费请求报文延迟高,相比于认证请求报文会延迟2-5min左右才发送,而出口设备联动要求完成计费报文交互才可放行认证终端上网 ,从而出现认证通过了但需要等一段时间才能上网的问题。
通过在服务器侧和AC端口镜像抓包分析看,终端认证通过后,radius报文交互中access-request与access-accept完成后,AC过了2min多钟才发送计费请求报文accounting-request。
检查AC配置并未发现异常,收集AC日志,发现日志中有QOS下发限速失败报错:
%Oct 22 15:01:09:403 2019 WX5540H QOS/4/QOS_AUTHCAR_APPLYUSER_FAIL: -MAC=XXXX-XXXX-033a-IP=X.X.17.16-SVLAN=516-Port=WLAN-BSS1/0/29297; Failed to apply the authorized CAR to the user.
现场是本地转发,有限速策略下发,策略下发到AC是正常,但本地转发情况下AC需要将策略下发到AP,此时出现问题。AC下发策略到AP是通过opflow下发CAR策略,由于openflow响应慢,导致portal计费请求发送慢,进一步排查openflow问题。
尝试在AC与AP之间抓包,分析现网抓包,openflow由AP发往AC的大包AC收不到,导致AP上openflow使用的TCP连接不断超时重连,(TCP载荷1448字节)。openflow的TCP载荷加上ETH头14字节,加上IP头20字节,再加上TCP头20字节共1502字节。尝试从AP ping 1472字节报文不通,怀疑链路中存在大包不通问题。
对比测试,将AP直连AC ping大包测试没问题,因此断定中间链路问题。
协调第三方厂家排查核心交换机及中间链路问题,后修改核心交换机MTU值后问题解决