iMC轮询设备告警晚于实际告警发生时间的原因分析
一、 问题描述:
使用iMC管理网络设备,在使用中发现iMC轮询发现某设备出现告警,如G1/2/1 is DOWN。该告警在网管中出现的时间却晚于该故障出现的实际时间,但是告警详细信息中体现的故障出现时间写的确实是故障出现的实际时间。
二、 过程分析:
出现这样的问题,原因在于在设备上,并未配置trap信息发往iMC服务器。
因此,iMC了解设备运行状态的方法只能通过周期轮询的方式进行,在iMC上,有两种轮询方式,一种是状态轮询,即检查设备可达性,通过ping来检查设备的管理地址对于网管是否处于可达状态,轮询间隔默认为1分钟;另外一种是配置轮询,即iMC服务器通过SNMP方式检查设备的配置和更多的状态信息,轮询间隔默认为2小时。
在上述问题中,由于设备没有配置trap信息发往iMC,在故障发生当时,iMC无法立即得知。且由于该接口并非设备和网管通信使用的接口,该接口DOWN掉并未造成iMC对该设备的不可达,因此状态轮询也无法发现该问题。
只有等待iMC下一个配置轮询间隔来到,iMC才会了解到该接口DOWN的的情况,因此最晚有可能该事件发生后2个小时在iMC告警界面上才出现告警。
由于在设备故障发生时,该事件的时间戳已经在相应的MIB节点写入。所以当iMC轮询时读取的就是这个时间戳,因此才会发生上述告警发现时间晚于告警实际时间,但是告警信息里的时间却是正确的这样的情况。
三、 解决方法:
了解了问题发生的来龙去脉,也就了解了如何解决该问题。很简单,只要在设备上使用snmp-agent target-host trap address命令将trap指向iMC即可保证iMC可以轮询设备,设备也可以随时上报自己的状态信息,实现了良性互动,就可以保证iMC的告警不再有这样的延迟了。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作