无特殊组网
现场反馈客户每天都会收到某几台设备未回应Ping报文的告警短信
现场是iMC冷备,配置了每天定时备份恢复任务。现场反馈客户每天都会收到某几台设备未回应Ping报文的告警短信,怀疑是iMC误报。
设备未回应Ping报文的告警是由iMC主动轮询设备并给设备发送ICMP探测报文,但却连续三次未收到设备的回应报文之后产生
具体Trap定义如图
在iMC主机上查看这几台设备状态是正常的,Ping可达,且主机从未产生过这几台设备的Ping不可达告警
在iMC备机上查看这几台设备状态是紧急,也的确产生了相关设备不可达的告警,并且告警产生的时间总是和配置的自动备份恢复的时间相近。备机前台和后台Ping探测时的确无法Ping通(存在丢包)。询问客户得知主备机并不在同一个网段,网络策略不同。
iMC冷备实际是两台独立的iMC,备机上无法增删改,但可以独立轮询设备并产生告警。
为什么总是在每天备份恢复之后重复产生告警?原因是主备机之间每天定时执行数据的自动备份恢复任务,主机是没有产生这几台设备的告警的,同步完成后备机数据就被主机数据覆盖,备机恢复完数据后会重启自身的进程并对所纳管的设备进行轮询,当发现这几台设备Ping不可达时便产生了告警。上述过程每天都会重复一遍,因此导致了该现象。
见上述过程分析
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作