在无线客户端关联体验中,无线用户短时间,随机性出现网络不通的问题往往由于其发生时间随机,故障持续时间短,手工重连即可恢复,客户端分布零散等客观因素,造成定位难度大。
此类问题,不同与普通的网络丢包现象,网络丢包是指时通时断,由于无线的重传机制,普通丢包对实时性低的使用影响不大,针对此,可以参考《无线终端丢包通用排查》知了案例。
此类问题,也不同于客户端频繁掉线的现象,客户端掉线通常表项为WIFI信号图标消失,客户端与AP已去关联。针对此,可以参考《无线终端关联故障通用排查》知了案例。
出现本文所指的网络中断问题时,WIFI图标仍然存在,但是PING不通网关,必须人为干预才可恢复,如重新开关网络适配器,重新关联等。遇到这种问题时,
(1)先摸索故障的规律性,如是否与AP型号强相关,客户端类型是否有特征,关联的频段及配置的加密方式是否有规律;
1、故障表现是否为异常中断
本文所指的网络中断问题时,客户端具备如下特性:
(1)WIFI图标仍然存在:
PC:
有时显示如下!号:;当出现!号时,通常是windows系统感知到网络出现问题,如公网不通或ARP学习异常。
IOS:
安卓:
WIFI图标仍然存在说明客户端仍能感知到AP的beacon帧。
(2)PING网关不通
无法PING通网关。通过运行cmd,输入ipconfig,可以看到设备获取的IP地址和默认网关,同时无法PING通网关。
(3)人为干预可恢复,如重新开关网络适配器,重新关联等,客户端就恢复网络连通性,有时客户端几分钟后自动就恢复了。
1、摸索外因规律
通过充分收集故障反馈,了解故障发生的多维特性:
(1)时间:收集故障发生的时间特性,比如上班高峰期,学生下课后等业务量较大的时间节点。
(2)地点:相同组网的不同地理位置,楼层、宿舍、网点等故障出现的规律性。
(3)关键事件:升级前后的变化,组网改造后的变化,IOS/安卓大规模更新后的变化等。
2、AP类型规律
外部因素规律有时无迹可寻,那么从内部因素来切入。
从接入侧即AP型号着手,摸索是否跟AP型号强相关,室内型/室外型,WAVE1/WAVE2,X分/放装/功分部署AP,终结者,大内存AP/小内存AP,FAT/FIT AP,COMWARE V5/V7等等。
3、客户端类型规律
从用户侧着手,常见的接入客户端有PC、手机/PAD,特殊客户端有扫描枪PDA/会议终端/视频盒子等其他WIFI设备,通常我们会比较不同客户端出现的频率。
4、配置规律
比较射频配置的不同:
(1)信道:是否存在信道的规律,尝试2.4G、5.2G、5.8G的不同信道
[AC-wlan-ap-ap1-radio-1]channel ?
INTEGER Legal channels: 36, 40, 44, 48, 52, 56, 60, 64, 149, 153, 157,
161, 165
[AC-wlan-ap-ap1-radio-2]channel ?
INTEGER Legal channels: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13
(2)频宽:是否存在频宽的规律,尝试20M、40M、80M
[AC-wlan-ap-ap1-radio-2]channel band-width ?
20 Specify the BandWidth Mode as 20M
40 Specify the BandWidth Mode as 20/40M
[AC-wlan-ap-ap1-radio-1]channel band-width ?
20 Specify the BandWidth Mode as 20M
40 Specify the BandWidth Mode as 20/40M
80 Specify the BandWidth Mode as 20/40/80M
(3)802.11模式: 是否存在802.11模式的规律,5G尝试11an、11ac、11a;2.4G尝试11b、11g、11gn
Comware V5:
[AC-wlan-ap-ap2]radio 1 type ?
dot11a Specify radio type as 11a
dot11ac Specify radio type as 11ac (Default)
dot11an Specify radio type as 11an
[AC-wlan-ap-ap2]radio 2 type ?
dot11b Specify radio type as 11b
dot11g Specify radio type as 11g
dot11gn Specify radio type as 11gn (Default)
Comware V7:
[AC-wlan-ap-ap1-radio-1]type ?
dot11a 802.11a
dot11ac 802.11ac
dot11an 802.11n(5GHz)
[AC-wlan-ap-ap1-radio-2]type ?
dot11b 802.11b
dot11g 802.11g
dot11gn 802.11n(2.4GHz)
(4)服务模板加密方式:是否存在加密方式不同的规律,尝试不加密、RSN+CCMP加密方式。
WPA+TKIP的加密方式限制客户端的协商速率最高54M。
wlan service-template 1 crypto
ssid 123
bind WLAN-ESS 1
authentication-method shared-key
cipher-suite tkip
cipher-suite ccmp
security-ie rsn
security-ie wpa
#
wlan service-template 2 clear
ssid fanjinshuai
bind WLAN-ESS 1024
service-template enable
(5)比较自动功率调整配置:建议关闭自动功率调整。
Comware V5:
[AC] wlan rrm
[AC-wlan-rrm]undo dot11bg calibrate-power self-decisive
Comware V7:
# RRM视图
[AC-wlan-ap-ap1-radio-1] rrm
[AC-wlan-ap-ap1-radio-1-rrm] undo calibrate-power self-decisive
#AP组RRM视图
[AC-wlan-ap-group-group1-ap-model-WA4320i-ACN-radio-1] rrm
[AC-wlan-ap-group-group1-ap-model-WA4320i-ACN-radio-1-rrm] undo calibrate-power self-decisive
(6)比较自动信道调整配置:建议关闭自动信道调整。
Comware V5:
# 关闭802.11a的信道监测
[AC-wlan-rrm]undo dot11a calibrate-channel
# 关闭802.11bg的信道监测
[AC-wlan-rrm]undo dot11bg calibrate-channel
Comware V7:
# RRM 视图
[AC-wlan-ap-ap1-radio-1] rrm
[AC-wlan-ap-ap1-radio-1-rrm] undo calibrate-channel self-decisive
# AP 组 RRM 视图
[AC-wlan-ap-group-group1-ap-model-WA4320i-ACN-radio-1] rrm
[AC-wlan-ap-group-group1-ap-model-WA4320i-ACN-radio-1-rrm]undo calibrate-channel self-decisive
#
(7)比较低速率配置:建议恢复低速率禁用配置。
在无线网络中信号覆盖全面的情况下,可以将1、2、6和9Mbps速率禁用,这样整体上减少广播报文和管理报文对空口资源的占用。但是个别客户端对速率协商支持不完善,可能造成数据不通。
Comware V5:
# 配置802.11g模式的射频速率(取消禁用低速率)。
[AC-wlan-rrm] undo dot11g disabled-rate
Comware V7:
# 配置802.11g模式的射频速率(取消禁用低速率)。
# AP radio视图
[WX5540H-wlan-ap-test-radio-2] rate supported 6 9
# AP组radio视图
[WX5540H-wlan-ap-group-ceshi-ap-model-WA4320-ACN-radio-2]rate supported 6 9
(8)比较广播Probe回应配置: 建议开启广播Probe探测功能。
网络优化时AP针对SSID为空的探测请求不进行回复,有效降低空口的消耗,使整个WLAN网络应用得到一定的提升,但有时个别客户端对收不到广播Probe回应反应异常,可能造成数据不通。
Comware V5:
# 在 ap1 上开启 AP 回复广播 Probe request 报文功能。 (AP 视图)
[AC-wlan-ap-ap1]broadcast-probe reply
Comware V7:
# 在 ap1 上开启 AP 回复广播 Probe request 报文功能。 (AP 视图)
[AC-wlan-ap-ap1] broadcast-probe reply enable
# 在 AP 组上开启AP 回复广播 Probe request 报文功能。 (AP 组视图)
[AC-wlan-ap-group-group1] broadcast-probe reply enable
(9)比较Option配置: 建议取消如下Option相关配置。
Comware V5:
#关闭弱信号拒绝接入
[AC]undo wlan option client-reject
#关闭漫游导航
[AC]undo wlan option roam-navigation
Comware V7:
[AC-wlan-ap-ap2-radio-1]undo option roam-navigation
[AC-wlan-ap-ap2-radio-1]undo option client reject
(10)比较Short-GI配置: Short-GI缺省开启,对比Short-GI关闭的效果。无线信号的空间传输会因多径等因素在接收侧形成时延,如果后面的数据块发送的过快,会和前一个数据块形成干扰。有时某些客户端的Short-GI功能实现不完善,容易造成数据不通。
Comware V5:
#关闭short-gi功能
[AC-wlan-ap-ap1-radio-1]display this
#
radio 1
undo short-gi enable
#
Comware V7:
[AC-wlan-ap-ap2]display this
#
wlan ap ap2 model WA4620i-ACN
serial-id 210235A1BRC145000105
vlan 1
radio 1
short-gi enable
radio 2
short-gi disable
gigabitethernet 1
(11)比较其他和接入相关的配置: 如是否开启认证,并对比测试最简配置时的情况。
1、故障是否能复现
根据以上问题复现的规律,尽可能创造故障复现的条件。由于此类问题复现的时间短,需要充分准备好排查工具及手段。
2、检查WLAN CLIENT表项
命令:display wlan client mac-address
例如:通过display wlan client mac-address 30b4-9e71-be03 verbose命令。检查如下参数。
IP:是否是正确的IP地址。
关联AP:是否关联正确AP。
SSID:关联SSID正确。
Sleep count:是否频繁增长。
RSSI:是否过低,低于20说明该AP感知到客户端的信号较弱。
Rx/Tx rate:协商速率是否维持个位数。
Online time:时间是否增长。
[AC]display wlan client mac-address 30b4-9e71-be03 verbose
Total number of clients: 1
MAC address : 30b4-9e71-be03
IPv4 address : 10.216.180.34
IPv6 address : N/A
Username : 30b49e71be03
AID : 10
AP ID : 10
AP name : lenovo_4f_ap10
Radio ID : 1
SSID : ymtc-l
BSSID : b0f9-6392-e400
VLAN ID : 122
Sleep count : 166860
Wireless mode : 802.11an
Channel bandwidth : 20MHz
20/40 BSS Coexistence Management : Supported
SM power save : Disabled
Short GI for 20MHz : Supported
Short GI for 40MHz : Not supported
STBC RX capability : Supported
STBC TX capability : Supported
LDPC RX capability : Not supported
Block Ack : TID 0 Both
Supported HT MCS set : 0, 1, 2, 3, 4, 5, 6, 7,
8, 9, 10, 11, 12, 13, 14,
15, 16, 17, 18, 19, 20,
21, 22, 23
Supported rates : 6, 9, 12, 18, 24, 36,
48, 54 Mbps
QoS mode : WMM
Listen interval : 1
RSSI : 36
Rx/Tx rate : 104/104
Authentication method : Open system
Security mode : RSN
AKM mode : PSK
Cipher suite : CCMP
User authentication mode : MAC
Online time : 4days 12hours 25minutes 59seconds
FT
status : Inactive
3、检查CLIENT STATUS表项
命令:display wlan client status mac-address
例如:通过display wlan client mac-address status 001c-f08f-f804 verbose命令。检查如下参数。
Access time:客户端接入无线服务所用的时间。
Received:客户端接收报文统计。
Sent:客户端发送报文统计。
Discarded:客户端丢弃报文统计:
<AC> display wlan client status mac-address 001c-f08f-f804 verbose
Total number of clients: 1
MAC address : 001c-f08f-f804
AP name : ap2
Radio ID : 2
Access time : 41 ms
RSSI : 0
Rx/Tx rate : 39/117 Mbps
Received:
Retransmitted packets : 84
Retransmitted packet ratio : 64.12%
Sent:
Retransmitted packets : 0
Retransmitted packet ratio : 0.00%
Discarded:
Discarded packets : 0
Discarded packet ratio : 0.00%
4、检查ARP表项
(1)检查网关的ARP信息中是否存在客户端的表项。
如果AC仅是二层接入,那么AC上不存在客户端的ARP信息。
[AC]display arp
Type: S-Static D-Dynamic O-Openflow R-Rule I-Invalid
IP address MAC address SVID Interface Aging Type
10.216.176.4 1cab-3411-04b2 121 BAGG2 17 D
10.216.184.95
e8b1-fcb0-03ba 123 WLAN-BSS1/0/210 20
D
(2)检查客户端的ARP表项信息。
通过在CMD输入ARP –A。
在CMD静态绑定ARP。输入ARP -S x.x.x.x xx-xx-xx-xx-xx
5、检查二层链路连通性
wlan link-test命令用来对客户端进行无线链路质量检测。无线链路质量检测,即AP根据客户端上线时协商的速率集,以每个速率发送5个空数据报文进行链路质量检测。AP根据客户端的响应报文可以获取AP客户端之间的无线链路质量信息,如信号强度、报文重传次数、RTT(Round-Trip Time,往返时间)等。
无线链路质量检测的超时时间为10秒,如果AP在超时时间内没有收到响应报文,将无法得到链路质量检测结果,即AP与客户端二层链路不通。
命令:wlan link-test
<AC> wlan link-test 60a4-4cda-eff0
Testing link to 60a4-4cda-eff0. Press CTRL + C to break.
Link Status
MAC address: 60a4-4cda-eff0
VHT-MCS Rate(Mbps) Tx packets Rx packets RSSI Retries RTT(ms)
NSS = 1
0 6.5 5 5 54 0 0
1 13 5 5 51 0 0
2 19.5 5 5 49 0 0
3 26 5 5 47 0 0
4 39 5 5 45 0 0
5 52 5 5 45 0 0
6 58.5 5 5 44 0 0
7 65 5 5 44 0 0
Tx packets:AP发送无线链路质量检测包的个数
Rx packets:AP收到客户端响应报文的个数
[AC]wlan link-test a086-c644-32a9
Testing link to a086-c644-32a9, press CTRL_C to break..
<AC>wlan link-test 6894-23BC-5748
Testing link to 6894-23bc-5748, press CTRL_C to break..
6、强制客户端唤醒
Comware V5:
#全局视图下配置,可分频段生效。
[AC]wlan option sleep-short enable 2g/5g
Comware V7:
7、第三方网卡抓包
(4)打开omnipeek,在“802.11”栏目选择信道。
(5)在“Filters”过滤器栏目输入客户端的MAC地址,并选择双向。
(6)点击右上角“Start Capture”开始抓包.
8、CRT脚本实时采集信息
对于故障现象难复现且时间短不好操作,可以通过实时监控,定时采集AP射频信息,用于回溯故障原因。
操作方法:
(1)设备准备,PC或者服务器,能接入管理网络;
(2)打开CRT,登陆AC,查看AP的IP地址;录AP的channel信息
(3)选择快速连接,直接登陆AP,不用到AC上跳转。
(4)登陆AP后,输入h3capdmin默认密码,记录会话,选择脚本->运行。如此重复,打开多个窗口,也可以打开多标签同时运行脚本。
(5)脚本:将脚本内容复制到记事本,并保存为js格式。
#$language = "JScript"
#$interface = "1.0"
var tabCount = crt.GetTabCount();
var gTab = "";
while(1){
for(var i = 1;i <= tabCount;i++){ //无限循环
gTab = crt.GetTab(i);
gTab.Screen.Send("return" + "\r");
gTab.Screen.Send("screen-len disable" + "\r"); //设置屏幕显示
gTab.Screen.Send("system" + "\r");
gTab.Screen.Send("probe" + "\r"); //此处以V7为例
gTab.Screen.Send("display clock" + "\r"); //显示时间
gTab.Screen.Send("display ar5 1 radio" + "\r"); // 采集5G射频口信息
gTab.Screen.Send("display ar5 1 ch" + "\r"); // 采集5G射频口信道利用率
gTab.Screen.Send("display ar5 1 nf" + "\r"); // 采集5G射频口底噪
gTab.Screen.Send("display ar5 1 reset" + "\r"); // 采集5G射频口芯片置位计数
gTab.Screen.Send("dis ar5 1 client all status" + "\r"); // 采集5G射频口客户端收发包
gTab.Screen.Send("dis ar5 1 client all rssi" + "\r"); // 采集5G射频口客户端信号
gTab.Screen.Send("reset ar5 1 client all" + "\r"); // 采集5G射频口客户端
gTab.Screen.Send("dis ar5 1 statis" + "\r"); // 采集5G射频口报文计数
gTab.Screen.Send("dis ar5 1 queue all" + "\r"); // 采集5G射频口转发队列
gTab.Screen.Send("reset ar5 1 statis" + "\r"); //清除5G射频计数
gTab.Screen.Send("display ar5 2 radio" + "\r"); // 采集2.4G射频口信息
gTab.Screen.Send("display ar5 2 ch" + "\r"); // 采集2.4G射频口信道利用率
gTab.Screen.Send("display ar5 2 nf" + "\r"); // 采集2.4G射频口底噪
gTab.Screen.Send("display ar5 2 reset" + "\r"); // 采集2.4G射频口芯片置位计数
gTab.Screen.Send("dis ar5 2 client all status" + "\r"); // 采集2.4G射频口客户端收发包
gTab.Screen.Send("dis ar5 2 client all rssi" + "\r"); // 采集2.4G射频口客户端信号
gTab.Screen.Send("reset ar5 2 client all" + "\r"); // 采集2.4G射频口客户端
gTab.Screen.Send("dis ar5 2 statis" + "\r"); // 采集2.4G射频口报文计数
gTab.Screen.Send("dis ar5 2 queue all" + "\r"); // 采集2.4G射频口转发队列
gTab.Screen.Send("reset ar5 2 statis" + "\r"); //清除2.4G射频计数
}
crt.Sleep(120000); //120000ms 即2mins采集1次
}
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作