如图,MSR3640使用R0007P02版本,通过mp口连接专线,由IMC V7作为网管管理。
该局点有一批同版本MSR3640,可以通过IMC正常添加,但只有一台在imc v7网管上无法添加设备:
检查imc license够用,并且确保snmp 团体字配置正确。那么,可能导致该问题的原因就不是imc报错的截图snmp读团体字错误了。这时,我们打开debug snmp开关,发现解析pdu报文的报错:
*Aug 6 00:13:41:441 2015 ABC.R1 SNMP/7/STACK_WARNING:
Processing error (error status: 130, error index: 1)
*Aug 6 00:13:41:441 2015 ABC.R1 SNMP/7/STACK_WARNING:
Processing error (error status: 130, error index: 2)
*Aug 6 00:13:41:441 2015 ABC.R1 SNMP/7/STACK_WARNING:
Processing error (error status: 130, error index: 3)
*Aug 6 00:13:41:442 2015 ABC.R1 SNMP/7/STACK_WARNING:
Processing error (error status: 130, error index: 4)
*Aug 6 00:13:41:442 2015 ABC.R1 SNMP/7/STACK_WARNING:
Processing error (error status: 130, error index: 5)
但是,这只是一些SNMP操作ipv6 相关节点失败的信息,并没有其他含义。看起来,从设备侧我们能够发现的排查线索有限,此时我们应该转向IMC侧,确认下IMC是操作什么节点错误,返回了什么错误。
查看IMC日志,我们发现是是读取设备接口信息时出错,接口信息读取不全,很多SNMP报文没有回应导致无法添加设备:
2015-08-07 04:52:11.793 [INFO (-5)] [THREAD(6664)] [CBulkSnmpOper::iGetVbList] snmp get oper ret fail.->DevIP[33.2.1.5],iOperType[1],strStartOid[1.3.6.1.2.1.2.2.1.1]
2015-08-07 04:52:11.793 [INFO (0)] [THREAD(6664)] [CLswInterfaceInfoImp::getInerfaceInfo] dev[33.2.1.5] Interface is incomplete, use get-next method
2015-08-07 04:52:27.793 [INFO (-5)] [THREAD(6664)] [CBulkSnmpOper::iGetVbList] snmp get oper ret fail.->DevIP[33.2.1.5],iOperType[1],strStartOid[1.3.6.1.2.1.2.2.1.1]
2015-08-07 04:52:27.793 [INFO (-5)] [THREAD(6664)] [CLswInterfaceInfoImp::getInerfaceInfoExt] call m_pSnmpOper->iGetVbList fail when access basic inter info of dev[33.2.1.5].
2015-08-07 04:52:27.793 [ERROR (0)] [THREAD(6664)] CDevMgr::getDevInterfaceInfo error. getInerfaceInfo() failed.
2015-08-07 04:52:27.793 [INFO (0)] [THREAD(6664)] Get device interface information failed. IP: 33.2.1.5
2015-08-07 04:52:27.793 [ERROR (0)] [THREAD(6664)] in CDevMgr::getDevData, getDevData error!!!!!!
为进一步确认问题根源,使用mib browser walk该设备的 if table,发现无法读取结果。同时walk同型号其他设备if table表象正常,读出550个节点。此时我们可以基本确定,问题和设备的接口有关。
我们再次排查设备诊断,发现设备有一个块HMIM板卡是非法状态:
Slot No. Board Type Status Max Ports
-------------------------------------------------------
0 RPU Normal 6
2 DSIC-9FSW Normal 9
4 DSIC-9FSW Normal 9
5 HMIM-2E1-F Normal 2
6 Unknown Illegal Unknown
7 HMIM-2E1-F Normal 2
那么,是否可能就是imc读取这块接口板上参数时发生错误,导致设备无法被添加呢。我们拔出接口板,问题解决。
更换故障板卡为正常板卡,问题解决。
从本则案例我们可以看到,尽管看起来板卡和IMC关系不大,但实际上IMC添加设备时也会读取各板卡的节点的,在这种前提下,平时巡检遇到设备板卡状态异常的情况应及时处理,不能因为暂不影响业务而搁置一边,以免造成更大问题。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作