某运营商局点AP异常上下线问题处理方法
一、问题描述:
1、某运营商局点在进行给AP供电的WP2016 POE注入器进行更换时,在AC设备上发现POE注入器上下挂AP处于Run/Idle状态频繁切换。经过很长时间后,才能够稳定上线(正常上线后,有时也会出现AP再次上下线情况发生)。但是也有个别AP在POE注入器重启后能够正常注册,没有出现频繁上下线现象。
2、在AC侧观察到即使没有重启的POE注入器,其下挂的AP状态也会出现Run/Idle频繁切换。
二、过程分析:
1、 对该局点无线网络拓扑了解如下:
2、 故障分析过程:
1) 查看AP注册状态:
远程登录AC设备,通过命令display wlan ap all查看AP注册状态显示Run/Idle不断切换,始终无法完成正常注册流程。
2) 查看POE交换机状态:
登录POE交换机通过命令display poe interface、display poe powersupply、display poe temperature-protection查看供电及使用情况,没有发现异常。重启该局点另一台POE注入器,同样频繁出现“上线—下线—再上线—再下线”类似情况。
3) 采集AC设备诊断信息:
登录AC设备收集下面诊断信息: debugging wlan lwapp event、debugging wlan lwapp error、debugging wlan lwapp packet control receive、debugging wlan lwapp packet control send抓取LWAPP协议报文,显示AP下线原因为AP与AC之间LWAPP心跳超时。
登录AP设备收集下面诊断信息:debugging wlan lwapp event、debugging wlan lwapp error、debugging wlan lwapp packet control receive、debugging wlan lwapp packet control send抓取LWAPP协议报文,提示:“No AC has responded to the Unicast Discovery request”、“Connection with AC 10.121.100.2 goes operational”、“Connection with AC 10.121.100.2 goes down by reason of Response Timer Expire”。根据获取到信息分析为AP发出请求报文,AC没有及时给予响应。
4) 排查网络有线侧:
在AC上看到AP下线时,通过Ping命令能够Ping通AP管理IP地址,通过Telnet也能够登录该AP,远程登录AP后,从AP上也能够Ping通AC,但有时AP停滞在Idle状态。从AC到AP、AP到AC两端同时Ping Size=8100偶尔出现丢弃少数数据包,如果不是两端同时(单方向)Ping size=8100未发现丢包。
5) 查看其它热点有无类似情况:
经与客户协调对另外一局点(因为这两个局点上行设备为同一汇聚交换机S3328所带)POE注入器经过重启,AP正常注册没有出现反复注册现象。
6) 查看设备两端(AC、AP)抓取数据包:
在WX6112E(AC侧)、WP2016(AP侧)同时进行双向数据包抓取,获取的协议报文数据如下图所示:
根据上面抓包信息分析,AP已发送字节数=1514的数据报文(以太网报文=1500),该报文需要进行分片处理,分片字节数分别为1478和60。从上面的信息可以发现AP已将LWAPP协议报文发出但AC并未收到大的分片报文,而该WTP EVENT关键报文的丢失导致AP不断上下线。所以该问题最终定位是中间有线网络问题,非我司设备问题。
四、解决方法:
该问题最终定位为有线网络将我司设备报文丢弃所致,建议优先排查有线侧网络问题。
我司在设备上进行软件调整规避该问题,方法如下:
1、 将wlan rrm视图下的dot11n protection enable功能关闭,减小LWAPP报文大小。
2、 把该局点AP调整为使用固定信道而非目前的自动信道,减小LWAPP报文大小。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作