某运营商局点AC主备切换异常
一、组网:
某市运营商网络中,在地市城域网中部署了WLAN网络,其中无线控制器板卡采用了N+1备份。所有的AP通过城域网采用option 43三层注册方式分别注册到各自主AC上,同时使用另一台AC作为Backup AC。两台主AC旁挂在S7506E上,S7506E同时作为公网Internet的出口设备。
二、 问题描述:
客户将主AC1重启后,所有下挂的AP都正常切换到了备份AC上,在主AC1正常启动后,发现AP并未切换回主AC1上。一线通过和客户协调,使用测试AP配置静态地址手工注册的方式向AC1发起注册,发现AP在不断向AC1发起注册请求但始终未收到AC1的回应,而AP和AC1是可以通过该地市城域网内互通的,另外AC1上开启debugging wlan lwapp all后无任何信息。
三、 分析过程:
按照常规思路分析故障
(1) 检查AC1当前工作状态以及有线侧网络状况,发现无线控制器设备工作正常,无论从AP还是AC1长ping对端设备都正常。在AC1和AP同时开启debugging wlan lwapp all后,发现AC1上没有debugging信息显示,AP上显示如下的信息:
*Dec 30 17:42:43:388 2012 WA2620i-AGN LWPC/7/Pkt_Send:
Sent Echo Request to 192.168.10.100 (Length: 14) //AP与备AC的LWAPP保活请求报文
04 00 00 08 00 00 16 1b 00 00 6b f2 c0 4f
*Dec 30 17:42:43:389 2012 WA2620i-AGN LWPC/7/Timer:
Created Nbr-Dead Timer
*Dec 30 17:42:43:389 2012 WA2620i-AGN LWPC/7/Pkt_Rcvd:
Received Echo Response from 192.168.10.100 (Length: 14) //收到备AC保活报文回应
04 00 00 08 00 00 17 1b 00 00 6b f2 c0 4f
*Dec 30 17:42:43:390 2012 WA2620i-AGN LWPC/7/Timer:
Deleted Nbr-Dead Timer
%Dec 30 17:42:52:889 2012 WA2620i-AGN LWPC/4/LWPC_UDISC_NO_AC_RESPOND:
No AC has responded to the Unicast Discovery request.
*Dec 30 17:42:52:889 2012 WA2620i-AGN LWPC/7/Event:
LWAPP to WMAC : Get basic binding configuration
*Dec 30 17:42:52:889 2012 WA2620i-AGN LWPC/7/Event:
LWAPP to WMAC : Get radio capability
*Dec 30 17:42:52:890 2012 WA2620i-AGN LWPC/7/Pkt_Send:
Sent Discovery Request to 192.168.10.99 (Length: 161) //向主AC1发送单播注册请求
04 00 00 9b 00 00 01 03 00 93 00 00 00 00 3a 00
01 01 03 00 10 00 00 00 45 10 60 cb 80 00 00 00
6f 02 02 00 00 32 00 4e 00 00 00 00 57 41 32 36
32 30 69 2d 41 47 4e 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00 00 00 32 31 39 38
30 31 41 30 43 4e 43 31 32 34 30 30 34 37 36 34
00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00
58 66 ba 6b f2 c0 04 00 02 01 22 04 00 02 02 15
05 00 14 32 31 39 38 30 31 41 30 43 4e 43 31 32
34 30 30 34 37 36 34 68 00 07 00 00 63 a2 00 d2
01
*Dec 30 17:42:52:890 2012 WA2620i-AGN LWPC/7/Timer:
Created Rdm-Disc Timer
*Dec 30 17:42:52:890 2012 WA2620i-AGN LWPC/7/Timer:
Refreshed Rdm-Disc Timer
*Dec 30 17:42:53:889 2012 WA2620i-AGN LWPC/7/Pkt_Send:
Sent Echo Request to 192.168.10.100 (Length: 14)
04 00 00 08 00 00 16 1b 00 00 6b f2 c0 4f
*Dec 30 17:42:53:889 2012 WA2620i-AGN LWPC/7/Timer:
Created Nbr-Dead Timer
*Dec 30 17:42:53:890 2012 WA2620i-AGN LWPC/7/Pkt_Rcvd:
Received Echo Response from 192.168.10.100 (Length: 14)
04 00 00 08 00 00 17 1b 00 00 6b f2 c0 4f
*Dec 30 17:42:53:890 2012 WA2620i-AGN LWPC/7/Timer:
Deleted Nbr-Dead Timer
*Dec 30 17:43:03:859 2012 WA2620i-AGN LWPC/7/Pkt_Rcvd:
Received Configuration Update Request from 192.168.10.100 (Length: 21)
04 00 00 0f 00 00 0c 11 00 07 6b f2 c0 4f cf 00
04 50 e0 7d 27
通过上面的debugging信息我们可以看到,AP和备AC的LWAPP隧道建立正常,同时也不断在向AC1发起单播注册请求,但始终未收到回应,证明option 43属性下发正常。
(2) 检查主备AC的配置,怀疑可能是主备配置不一致导致,检查后发现并无异常,而且AC2管理的AP全部工作正常、主备切换正常,于是对比AC1和AC2的配置,发现AC1上多了如下的配置:
#
interface Vlan-interface48
ip address 192.168.10.99 255.255.255.0
nat outbound 2001
nat server protocol udp global 192.168.10.99 any inside 192.168.20.1 any
#
interface Vlan-interface2500
ip address 192.168.20.1 255.255.252.0
portal server pts method direct
portal domain pt
portal nas-ip 192.168.20.1
#
经了解,以上配置是之前准备和第三方服务器对接测试的时候添加的,但添加后就出现主备切换异常的问题。通过display ip interface brief查看发现vlan 2500的三层接口处于down的状态,当前组网下AC只有一个三层接口,同时供AP注册使用和用户访问公网,怀疑是这两条和NAT相关的命令导致主备切换异常,和客户沟通后undo这两条命令,所有的AP都切换回到主AC1上,工作正常。
(3) 通过查看命令手册,理解nat outbound和nat server的含义:
(a).nat outbound命令用来配置出接口地址关联。若配置了访问控制列表,则表示将一个访问控制列表ACL和一个地址池关联起来,即符合ACL规则的报文的源IP地址可以使用地址池中的地址进行地址转换。在这个组网下,AC1实际上只有一个三层接口(interface vlan 48),这种情况下在使用这个接口的IP地址做公网地址转换的时候,有可能随机占用LWAPP的端口号12222、12223以及其他特殊端口(如Radius、Portal等),建议配置为nat outbound acl number address-group group number,采用配置地址池的方式进行地址转换。
(b).nat server用来定义一个内部服务器的映射表,用户可以通过global-address定义的地址和global-port定义的端口来访问地址和端口分别为local-address和local-port的内部服务器。在实验室复现现场组网,当local-address的interface vlan处于up状态时,AP主备切换正常,但若该三层接口处于down状态,则会导致AP和主AC1的LWAPP报文被丢弃,因此产生AP无法从备AC切换注册到主AC1上。
四、 解决方法:
(1) 删除该interface vlan接口下的nat outbound和nat server这两条命令,主备切换正常。
(2) 如果确实必须配置nat server和nat outbound这两条命令,可以:
(a).AC1上再配置一个interface vlan三层接口,供AP注册使用,即AC1的私网管理地址,当前的interface vlan 48作为公网的出口IP地址,配置nat命令。
(b).修改配置命令,改为nat outbound acl number address-group group number,配置address-group,用地址池的公网地址进行地址转换,防止特殊端口被意外占用,同时在配置nat server命令时,必须保证私网IP地址对应的interface vlan三层接口处于up状态。
注:在现网应用的设备上配置的命令前,一定要先仔细查看命令手册,了解该命令的实现功能以及不同环境下的配置要求,否则可能会导致设备工作状态异常,影响客户现网应用业务。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作