你遇到的这个“设备响应时间超过阈值”的告警,监控机制并不是简单的单次ping,而是在一个周期内执行多次探测,并取平均值与你的阈值进行比较。
具体来说,流程是这样的:
指标定义:iMC性能监视中的“设备响应时间”指标,衡量的是“目标设备向网管服务器发送ping响应报文所花的时间(ms)”。
采集周期:你看到的“300s”是性能采集周期。在这个周期内,iMC会发起一次性能数据采集任务,获取“设备响应时间”这个指标的数值。
采样方式:在每个采集周期内,iMC并不是只发一个ping包,而是会发送多个(默认通常是3个)ICMP探测包。
数值计算:iMC会计算这组探测包的平均往返时间(RTT),这个平均值就是本次采集得到的“设备响应时间”指标值。这意味着,即使有个别探测包延迟很高,只要平均值低于阈值,也不会触发告警。
告警对比:iMC会将计算出的平均值与你在监视设置里配置的阈值进行比较。只有当这个平均值超过阈值时,才会触发“设备响应时间过长”的告警。
除了平均值与阈值的对比,iMC还有一些其他机制会影响告警的触发,可以帮助你更精准地判断:
“设备不可达”告警:如果在一个采集周期内连续发送的多个ping包全部失败(默认是3个),iMC就会判定设备不可达,并产生更严重的“设备未回应Ping报文”告警。这个阈值和时长等参数可以在 系统 -> 系统配置 中进行修改。
告警重复与持续时间:在阈值告警规则中,通常还可以设置告警的重复次数和持续时间。例如,可以要求“连续两次采集周期平均值都超过阈值”才真正触发告警,这样可以有效避免网络瞬时抖动引起的误报。
暂无评论
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论