某局点反馈,该局点新买了十几台WA4320的AP,都无法跨公网注册上线,通过display wlan ap all命令看到的AP的状态一直在C和I之间转换。
[NM-HH-CS-AC-1.MAN]dis wlan ap all | in WA4320
ap01 I WA4320 219801A0UE8172E04745
ap02 I WA4320 219801A0UE8172E04747
ap03 C WA4320 219801A0UE8172E04724
AC的型号是LSQ1WCMB0,AC 刚升级为Release 2509P58。AP的版本为出厂版本,比较老。
无
AP注册不上的原因有很多,先按照一般常规思路来排查。
步骤一:检测AP是否能正常获取到IP地址,是否可以Ping通。
检查发现AP 已经正常获取IP地址,AC可以Ping通AP。
步骤二:在AP 可以Ping通的基础上Telnet到AP上查看版本信息。检查AC 和AP的版本是否一致。考虑到AC 刚刚升级,且新上AP的出厂版本比较老,检查是否AP没有成功下载新版本,出现版本不匹配的情况导致注册不上。
检测AC 发现AC 的上并没有配置firmware-update disable这条命令, AP 的版本应该会随着AC 版本升级而一起升级,远程登录AP查看版本发现已经升级到最新的1508P08版本了。AC 和AP的版本匹配没有问题。
步骤三:排查AP是否正确的获取到AC的地址。
在AP上手动指定AC的IP地址进行注册。命令
[ap]wlan ac ip 192.168.134.82
测试手动指定AC地址后也无法注册上线。
步骤四:在AC 和AP上同时进行debug,查看AP注册流程走到哪一步了。AC的IP地址为192.168.134.82,AP的IP地址为192.168.140.80。
<ac>debugging wlan lwapp all
可以看到以下显示信息
*May 4 05:03:23:498 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Rcvd:
Received Discovery Request from 192.168.140.80 (Length: 174)(to 192.168.134.82)
…
*May 4 05:03:23:500 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Send:
Sent Discovery Response to 192.168.140.80 (Length: 64)(from 192.168.134.82)
…
*May 4 05:03:25:691 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Rcvd:
Received Join Request from 192.168.140.80 (Length: 167)(to 192.168.134.82)…
*May 4 05:03:25:693 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Send:
Sent Join Response to 192.168.140.80 (Length: 71)(from 192.168.134.82)
…
*May 4 05:03:25:695 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Send:
Sent Join Confirm to 192.168.140.80 (Length: 45)(from 192.168.134.82)
…
*May 4 05:03:25:700 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Rcvd:
Received Configuration Request from 192.168.140.80 (Length: 1383)(to 192.168.134.82)
… //AP 注册流程终止在此处。
*May 4 05:03:37:711 2017 NM-HH-CS-AC-1.MAN LWPS/7/Pkt_Rcvd:
Received Discovery Request from 192.168.140.80 (Length: 174)(to 192.168.134.82) //注册流程没能继续下去,AP重新发起了注册请求。
从AC侧的Debug信息看,AP注册流程中断在配置下发环节。由于AP远程部署在公网另一侧,没法Console登录收集Debug信息。而远程登录到AP上收集信息时,一旦8分钟内AP没有注册到AC上就会自动重启导致远程中断,无法收集信息。删除AP的版本后,AP不再重启,可以保持稳定远程状态,再在AP 上进行Debug
<ap>debug wlan lwapp error
<ap>debug wlan lwapp event
收集的信息如下
*May 4 10:51:10:976 2017 WA4320 LWPC/7/Pkt_Send:
Sent Discovery Request to 192.168.134.82 port 12223 (Length: 174)
…
*May 4 10:51:04:977 2017 WA4320 LWPC/7/Pkt_Rcvd:
Received Discovery Response from 192.168.134.82 port 12223 (Length: 64)
…
*May 4 10:51:07:464 2017 WA4320 LWPC/7/Pkt_Send:
Sent Join Request to 192.168.134.82 port 12223 (Length: 167)
…
*May 4 10:51:07:466 2017 WA4320 LWPC/7/Pkt_Rcvd:
Received Join Response from 192.168.134.82 port 12223 (Length: 71)
…
*May 4 10:51:07:469 2017 WA4320 LWPC/7/Pkt_Rcvd:
Received Join Confirm from 192.168.134.82 port 12223 (Length: 45)
…
Sent Configuration Request to 192.168.134.82 port 12223 (Length: 1383)
…
*May 4 10:51:07:471 2017 WA4320 LWPC/7/Timer:
[TUNNEL:0] Created DataChannelKeepAlive Timer, Time long:3(s), LoopType:Loop.
*May 4 10:51:10:953 2017 WA4320 LWPC/7/Timer:
[TUNNEL:0] handle DataChannelKeepAlive Timer.
*May 4 10:51:10:954 2017 WA4320 LWPC/7/Error:
Retransmit failed, count reach max [1], MsgType:10, TunnelStrongFlag:0.
//AP debug信息显示传输失败,重传次数达到最大值。
…
*May 4 10:51:10:958 2017 WA4320 LWPC/7/Pkt_Send:
Sent Discovery Request to 192.168.134.82 port 12223 (Length: 174) //AP重新发起了注册请求。
在AC 和AP之间Ping 1500字节的大包测试,没有丢包,链路的连通性没问题。但是LWAPP隧道报文是UDP 报文,和ICMP的报文不一样。结合现场反馈的情况分析:AP跨公网注册,AP的状态可以到达C,最大的怀疑点就是公网链路的问题导致隧道报文传输失败。AP 注册时已经能够正常下载版本了,说明路由、版本是没有问题,剩下的只能怀疑到UDP报文大包分片的问题了。怀疑是中间网络设备UDP大包分片有问题,导致携带了AP配置信息的UDP报文一直传输失败。考虑修改注册VLAN接口允许的最大传输单元大小,即MTU值,取值范围为46~1560,单位为字节。默认值为1500字节
在AC的注册VLAN接口下修改MTU值,
[H3C_6108]interface vlan 1
[H3C_6108-Vlan-interface1]mtu 1300
修改配置后AP 能正常上线了
修改AC注册VLAN接口下的MTU值。适当减小MTU值后,AP能够正常注册上线。
一般在AP注册的时候我们也会通过Ping 1500字节的大包来测试链路的质量。但是ICMP大包能过不代表UDP大包能过,不能一概而论。在AP 注册的过程中,下载版本主要是一些UDP小包报文,而下载配置信息时是一些UDP大包报文。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作