IMC平台资源管理中能够看到设备是无线AC,但是WSM无线业务管理中看不到此AC;
IMC拓扑中能看到IP拓扑和我的网络拓扑,但是看不到无线拓扑;
IMC无线业务管理中看到的AP数比直接在AC上看到的AP数小,iMC查看无线数据有丢失;
IMC无线业务管理中看到AC无线控制器处于同步失败状态;
无。
IMC通过SNMP协议读取所管理设备的信息,当设备加入iMC后平台会自动读取设备的mib信息,如果识别到设备是无线设备,还会继续读取设备的无线mib信息,但有些时候由于无线mib信息读取失败就会造成平台已经正确识别了设备为无线设备,但是WSM组件由于没有读取到无线信息,所以造成无线业务管理中找不到此设备,无线拓扑找不到等所有无线相关的信息无法显示的问题。
1. 有可能之前添加AC时SNMP参数配置正确,但是后来被修改了导致现在读取失败。
所以可以现在设备详细信息页面,点击【配置-修改SNMP参数】来修改校验一下SNMP参数,确保配置正确。如下图所示:
2. 无线控制器AC上通常会注册大量的AP,iMC通过AC就可以读取到所有AP的信息,AP数量越多iMC同步所需的时间就会越长。所以可以将iMC同步AC的SNMP超时时间调大一些,如下图所示:
3. 某些较老版本的AC其默认SNMP mib-stype可能是compent模式,但是iMC新版本中都默认以new模式读取设备的mib信息,所以可能会导致读取不到所需的结果。需要将AC上的mib style改成new模式。命令为:[sysname] snmp mib-stype new,执行完成后需要重启AC才能生效。
4. 如果以上步骤排查完成后还是同步成功AC,那么有可能是后台数据处理有问题导致,需要收集同步AC过程中在iMC服务器上的抓包和WSM后台调试日志分析。收集方法为:(1)先将imc\server\conf\qvdm.conf文件中的LogLevel = INFO改成LogLevel = DEBUG,然后在iMC部署监控代理中重启imcwlandm.exe和imcwlanperfdm.exe进程。在iMC服务器上开启抓包软件捕获网卡报文。
(2)在iMC资源管理页面中点击同步AC(或者删除AC后重新添加),等到彻底同步结束后再停止抓包和拷贝日志文件imc\server\conf\log\imcwlandm.txt。
注:同步过程可能耗时较长,只有当日志中出现pVendorDev->getWlanData error. It's not an AC device maybe.或者dealAddNewDev error.字样时才表示彻底同步失败。如果不会看日志的话就尽量多等会,一般以100AP/10min判断同步是否结束。
5. 收集好日志文件后就是对文件的分析,造成同步失败的原因很多,这里举例介绍几种常见的以供参考。
先在后台日志中搜索关键字pVendorDev->getWlanData error. It's not an AC device maybe.如果搜索不到,可以搜索CWlanDBOper::updateWlanDataDB error,这个表示数据库更新失败。一般问题就会出现在以上关键字的前三行内。
数据库信息的收集,config_db这个数据库的tbl_dev表,根据ip可以查到AC的dev_id. 这些都可以作为查找具体AC同步失败或失败原因的依据。
(1)非正常结束错误
当日志中出现Abnormal ending when reading a table. Commit SNMP operation error. 时,表示此时在获取该节点时,出现了请求OID和设备返回OID不对称的现象,这种情况下需要提供WSM的debug日志以及抓包,然后找到这个节点并在抓包中找到。案例如下:
具体看红色文字部分,WSM请求的OID the def oid is: 1.3.6.1.4.1.25506.2.75.3.1.1.1.2,设备返回的OID the dev oid is:1.3.6.1.4.1.25506.2.75.3.1.1.1.3.0.7.168.67.20.198,比较明显两个OID不统一,就认为同步有问题,识别失败。这种问题就是设备问题了,设备返回不正确,所以导致了同步失败。
(2)请求超时
在日志中,当在以上关键字前三行内出现time out…..时,表示WSM在同步请求get节点时,出现了超时,这种情况下,需要以下步骤。第一、先建议把SNMP参数调为v1,然后尝试同步看是否能够成功。第二、如果仍旧不可以,需要由研发查看后台代码,找到time out出现在获取什么内容时,然后找出这些节点,通过这些节点在抓包中搜索,找到抓包中出现的位置,由设备进行定位。案例如下:
(3)入库失败
在日志中搜索CWlanDBOper::insertWlanDataDB error,出现这种错误可以查看具体出错的SQL语句,找到原因。这种错误出现一种可能是设备返回数据有问题,一种可能是升级后数据库表字段有问题。案例如下:
第一句如下:
[CQvDBConnADP::executeSQL] Execute "bulk insert tbl_capwap_tunnel_info from 'C:\Program Files\iMC\server\bin\..\../server/data/wlandm/140.txt' with (FIELDTERMINATOR = ',|', ROWTERMINATOR = '\n')" failed, errorMsg:Violation of PRIMARY KEY constraint 'PK__tbl_capw__C003D25002C769E9'. Cannot insert duplicate key in object 'imc_wsm.tbl_capwap_tunnel_info'. The duplicate key value is (00:00:00:00:00:00, 106).
通过第一句SQL错误,可以看出来,是tbl_capwap_tunnel_info中数据出现了主键冲突,具体为什么会主键冲突,就需要分析这个140文件,所以需要收集这个文件给研发。
140文件如下,可以看出前面字段有问题,全是00:00:00:00:00:00,需要查代码确认,是获取哪个字段得到,然后看设备是否就是这样,如果是就是设备有问题。一般情况都是设备返回问题。
00:00:00:00:00:00,|68,|0,|75474,|0,|75474
00:00:00:00:00:00,|68,|0,|75465,|0,|75465
00:00:00:00:00:00,|68,|0,|75472,|0,|75472
00:00:00:00:00:00,|68,|0,|75465,|0,|75465
00:00:00:00:00:00,|68,|0,|75470,|0,|75470
00:00:00:00:00:00,|68,|0,|75465,|0,|75465
如果SQL错误中出现类似这种errorMsg:Invalid column name 'client_forward_mode'.,这说明是对应表中少了字段,属于WSM的问题。
(4)更新数据库失败
如果设备已经加入了无线,同步失败,并且搜索到CWlanDBOper::updateWlanDataDB error。这说明在同步AC时,极有可能是设备上给的数据出现问题,与上述入库失败问题类似,找到出错的SQL分析是哪种错误。
6. 以上是几种常见的后台处理问题,如果现场排查后还是无法解决问题,请将抓包和日志文件一并发给技术支持中心分析。
iMC对设备的识别和管理都是通过SNMP协议进行的,所以务必保证iMC参数配置正确,报文交互正常。
每步排查完成后都需要手工点击同步一次设备才能验证修改是否有效。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作