现场为常规的无线组网环境。AC无线控制器旁挂在核心交换机上。
客户现场一栋楼的WA4620I-CAN注册不上线,客户描述设备型号为WA4620i-ACN,现场控制器型号为WX3540H,客户描述,故障时所有AP的状态,在AC上查看均为I状态。均无法正常上线。
(1)根据现场所有AP均为“I”状态的这个情况,查看AP的规格未满,license剩余量足够,且适配关系正常,初步判断,现场所有AP均未获取IP地址,AP的注册管理网段的DHCP是做在AC上的。正常情况下我们可以使用PC接到POE交换机上进行测试,看下PC是否能够获取地址。但是现场因为机房条件限制,不能这样测试,且AP已经放置在天花板上。
(2)遂准备在接入交换机上,查看下mac表,找到对应接口下联的AP的mac地址,然后在和AC上看下是否有该AP的arp信息,以及DHCP地址分配信息。但是非常奇怪的是,在AC上查看dhcp空闲的ip地址为空,另外,查看设备在用的IP地址也为空。
Pool name: vlan2110
Network: 10.100.32.0 mask 255.255.240.0
IP ranges from 10.100.43.181 to 10.100.43.182
IP address Client identifier/ Lease expiration Type
Hardware address
(3)查看设备的arp表项信息,发现arp表项也非常异常,存在很多ARP表项中,IP地址不同,但是mac地址相同的情况。初始以为是网络中有攻击导致的,后续想到,查看display dhcp server free-ip里面是空的,那么这个地址应该是被分配过,而且,arp表项中的显示的ip地址,也确实为vlan 2110地址池中的地址。于是想看下是否dhcp存在分配异常的情况导致的该现象。
===============display arp all===============
===================================================
Type: S-Static D-Dynamic
IP Address MAC Address VLAN ID Interface Aging Type
10.100.44.173 80f6-2e4e-9c60 2110 GE1/0/1 17 D
10.100.44.252 80f6-2e4e-9c60 2110 GE1/0/1 17 D
10.100.45.50 80f6-2e4e-9c60 2110 GE1/0/1 17 D
10.100.45.106 80f6-2e4e-9c60 2110 GE1/0/1 17 D
10.100.36.170 80f6-2e4c-4a00 2110 GE1/0/1 17 D
10.100.44.190 80f6-2e4c-4a00 2110 GE1/0/1 17 D
10.100.44.254 80f6-2e4c-4a00 2110 GE1/0/1 17 D
10.100.45.44 80f6-2e4c-4a00 2110 GE1/0/1 17 D
10.100.44.182 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.44.198 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.45.22 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.45.32 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.45.52 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.45.107 70ba-efca-1f20 2110 GE1/0/1 17 D
10.100.36.137 80f6-2e4e-7fc0 2110 GE1/0/1 17 D
10.100.44.239 80f6-2e4e-7fc0 2110 GE1/0/1 17 D
10.100.45.17 80f6-2e4e-7fc0 2110 GE1/0/1 17 D
10.100.45.29 80f6-2e4e-7fc0 2110 GE1/0/1 17 D
10.100.45.88 80f6-2e4e-7fc0 2110 GE1/0/1 17 D
(4)后来在AC上查看设备上是否存在dhcp服务器冲突的情况,发现本该给ap分配地址用的地址池中,几乎所有的地址都在冲突列表中。
IP address Detect time
10.100.42.203 Nov 15 20:09:36 2019
10.100.42.202 Nov 15 20:09:36 2019
10.100.42.204 Nov 15 20:09:36 2019
10.100.42.205 Nov 15 20:09:36 2019
10.100.42.206 Nov 15 20:09:36 2019
10.100.42.207 Nov 15 20:09:36 2019
10.100.42.208 Nov 15 20:09:37 2019
10.100.42.210 Nov 15 20:09:37 2019
10.100.42.209 Nov 15 20:09:37 2019
10.100.42.211 Nov 15 20:09:37 2019
10.100.42.212 Nov 15 20:09:37 2019
10.100.42.213 Nov 15 20:09:37 2019
10.100.42.214 Nov 15 20:09:38 2019
10.100.42.215 Nov 15 20:09:38 2019
10.100.42.216 Nov 15 20:09:38 2019
10.100.42.217 Nov 15 20:09:38 2019
10.100.42.219 Nov 15 20:09:38 2019
10.100.42.218 Nov 15 20:09:38 2019
10.100.42.220 Nov 15 20:09:38 2019
(5)查看设备可能会存在dhcp地址冲突记录的几点原因,发现有如下三种原因:
【使用指导】
DHCP服务器在下列几种情况下会生成地址冲突信息:
· DHCP服务器在为客户端分配IP地址前,通过ping操作检测到网络中已有主机使用该地址。
· DHCP客户端向DHCP服务器发送Decline报文,报告DHCP服务器为其分配的地址存在冲突。
· DHCP服务器检测到地址池内的可供分配的地址是设备自身的地址。
经过查看,第1中和第三种原因,可以排除,只有第二种原因,可以迅速耗尽设备16位掩码的地址段。后续需要看下终端什么情况下会向DHCP服务器发送Decline拒绝报文。
(6)对比DHCP地址获取和下发过程可以发现,客户端收到服务器返回的DHCP-ACK确认报文后,会以广播的方式发送免费ARP报文,探测是否有主机使用服务器分配的IP地址,如果在规定的时间内未收到回应,并且客户端上不存在与该地址同网段的其他地址时,客户端才使用此地址。否则,客户端会发送DHCP-DECLINE报文给DHCP服务器,并重新申请IP地址。
图1-2 IP地址动态获取过程
如图1-2所示,DHCP客户端从DHCP服务器获取IP地址,主要通过四个阶段进行:
(1) 发现阶段,即DHCP客户端寻找DHCP服务器的阶段。客户端以广播方式发送DHCP-DISCOVER报文。
(2) 提供阶段,即DHCP服务器提供IP地址的阶段。DHCP服务器接收到客户端的DHCP-DISCOVER报文后,根据IP地址分配的优先次序选出一个IP地址,与其他参数一起通过DHCP-OFFER报文发送给客户端。
(3) 选择阶段,即DHCP客户端选择IP地址的阶段。如果有多台DHCP服务器向该客户端发来DHCP-OFFER报文,客户端只接受第一个收到的DHCP-OFFER报文,然后以广播方式发送DHCP-REQUEST报文,该报文中包含DHCP服务器在DHCP-OFFER报文中分配的IP地址。
(4) 确认阶段,即DHCP服务器确认IP地址的阶段。DHCP服务器收到DHCP客户端发来的DHCP-REQUEST报文后,只有DHCP客户端选择的服务器会进行如下操作:如果确认将地址分配给该客户端,则返回DHCP-ACK报文;否则返回DHCP-NAK报文,表明地址不能分配给该客户端。
客户端收到服务器返回的DHCP-ACK确认报文后,会以广播的方式发送免费ARP报文,探测是否有主机使用服务器分配的IP地址,如果在规定的时间内未收到回应,并且客户端上不存在与该地址同网段的其他地址时,客户端才使用此地址。否则,客户端会发送DHCP-DECLINE报文给DHCP服务器,并重新申请IP地址。
如果网络中存在多个DHCP服务器,除DHCP客户端选中的服务器外,其它DHCP服务器中本次未分配出的IP地址仍可分配给其他客户端。
(7)经过上述,对DHCP服务器存在的地址冲突,以及冲突原因分析,怀疑是DHCP服务器给终端发送了DHCP-ACK报文后,AP发送了免费ARP报文后,由于网络存在环路,然后又被自己收到,导致AP误以为该地址已被其他终端使用,从而发送DHCP-DECLINE给服务器,然后重新申请新的IP地址。当网络中存在大量的ap进行请求dhcp,同时网络中存在环路的时候,DHCP地址会被快速耗尽,所以后续需要排除网络中的环路。由于现场的ap均安装在了天花板内,后续协调客户打开天花板查看发现,现场的AP均使用了双线上行连接POE交换机,从而导致了环路的产生,改为单纤接入使用后,上线正常。
AC上存在大量的一个MAC地址对应多个IP地址的情况,查看存在大量的地址冲突。根据dhcp原理,怀疑是由于环路导致的。后续先排查是否有存在ap上的上行接口之间环插的情况,另外排查看下现场二层网络环境下是否有环路,排除网络环路问题。由于现场的ap均安装在了天花板内,后续协调客户打开天花板查看发现,现场的AP均使用了双线上行连接POE交换机,从而导致了环路的产生,改为单纤接入使用后,上线正常,问题解决
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作