网管服务器重复收到AC热启动告警的处理方法
一、 组网:
二、 问题描述:
某电信网管中心反馈某台AC在不停向网管服务器上报热启动告警,告警次数达到54次以上。网管告警截图如下:
三、 过程分析:
1、根据网管的告警信息得知是地址为A的AC,核对AC的运行时间,可以得知:网管的告警时间和AC的运行时间矛盾,AC没有发生重启。
2、在AC上display trapbuffer,搜索有如下重要信息:
#Oct 22 16:32:25:600 2012 xxxx DEVM/4/SYSTEM WARM START:
Trap 1.3.6.1.4.1.2011.10.6.8.5
: system warm start. #Oct 22 16:33:25:600 2013 xxxx DEVM/4/SYSTEM WARM START:
Trap 1.3.6.1.4.1.2011.10.6.8.5
: system warm start. 结论: AC的确在不停向网管服务器上报热启动告警的信息
3、仔细检查现网AC的配置,发现如下异常配置:
(a) AC配置解释如下:
resend-interval 60 //重发周期60s
collection-interval 10 //采样周期10s
(b) 由此联想到告警重发规则,规则如下:
hwSysTrapResendPeriod-------------重发周期R
hwSysTrapCollectionPeriod------------采样周期C
hwSysTrapSendNum----------------重发机制下,最大发送次数N
(1) R=0 且 C≠0,不管N为何值,都只根据周期C的值,发送一次故障告警,或者一次恢复告警-------------本次需求重发周期设置为0时,发送一次
(2) R=0 且 C=0,不管N为何值,都停发告警,包括故障告警及恢复告警
(3) R≠0 且 C≠0, N=0,表示发送次数没有限制,只要一直满足告警条件,故障告警按周期C重复发送,但恢复告警只发送一次
(4) R≠0 且 C≠0, N≠0,故障告警及恢复告警按周期C,在满足重发的情况下会发送N次
(5) R≠0 且 C=0,不允许设置.因此设置时,必须先设置C,后设置R,或者2个一起设置.
ps: R,C均不为0时,仍然需要满足原来的要求, R>=3*C
4、由于上述配置满足R≠0 且 C≠0, N=0的重发规则,所以AC热启动告警在不停向网管服务器上报。
四、 解决方法:
重发周期R设置为0,C≠0 满足重发规则的第一条,删除命令resend-interval 60 ,问题即可解决。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作