IMC网管平台运行十几个小时实时告警不产生了,重启告警管理程序进程imcfaultdm后恢复正常,什么原因造成的?服务器内存溢出还是其他问题
(0)
最佳答案
iMC对设备的监控使用的是SNMP协议
1.检查iMC安装运行情况
iMC智能管理中心采用的是平台(PLAT)+组件(如EIA,WSM等)的方式安装部署。而管理网络设备,在设备发送故障时产生告警的功能依赖的是PLAT,也就是说只需要安装部署平台就能够对设备进行监控管理并且能够及时产生告警,而平台的功能模块中最重要的就是资源管理和告警管理了,所以出现问题第一步要检查平台是否安装部署完整并运行正常。
2.检查设备SNMP配置情况
iMC对设备的管理使用的是SNMP协议,设备故障发生后也是产生SNMP Trap报文通知iMC服务器的。所以接下来就需要检查网络设备的SNMP功能是否已经正确配置并且iMC能识别到设备的详细信息。设备上的SNMP配置主要有:
snmp-agent
snmp-agent local-engineid 800063A200E0FC0000026877
snmp-agent community read public
snmp-agent community write private
snmp-agent sys-info version all
snmp-agent target-host trap address udp-domain 192.168.113.9 params securityname public v2c
iMC在添加设备时需要设备正确的SNMP读写团体字,添加完成后要能够看到设备的详细信息,比如设备名称、设备型号等信息。
说明:
n 如果配置的是SNMP V1&V2C版本,读团体字必须要配,写团体字最好能够配上,如果是SNMP V3则也需要赋予安全用户对应的SNMP读权限;
n 必须要配置SNMP Trap发送到iMC服务器地址,H3C交换路由在配置Trap发送时要先执行snmp-agent trap enable命令激活一下Trap发送功能,请根据具体设备型号确认;
3.是否上联iMC端口
iMC管理下网络设备的接口可以分为上联iMC接口和非上联iMC接口。如果是非上联iMC的接口DOWN掉,设备的Trap报文发送给iMC正确产生告警,如果是上联iMC的接口DOWN掉,由于DOWN掉之后设备就无法和iMC通信了,所以即使设备产生了Trap也不能发送到iMC,所以iMC也就无法产生告警。一般上联口就是设备路由表中指定的到iMC服务器的出接口,也就是设备给iMC发送报文时使用的源地址那个接口。判断是不是上联口最简单的方法就是当接口DOWN掉之后在设备上ping一下iMC服务器,如果能ping通说明DOWN的不是上联iMC接口,如果ping不通则说明就是上联iMC接口。
4.检查网络问题
如果iMC服务器无法正常收到设备发送过来的Trap报文,则肯定是设备没有发送或者设备到iMC之间的这段网络有问题导致报文未能成功到达接收端。对于设备没发的情况可以在设备上执行debug snmp packet命令来确认,如果在事件发生后有对应的OID输出则证明设备已经产生SNMP Trap报文;对于网络问题可以逐跳排查检查报文丢失在哪一段,重点关注网络的中各个设备的ACL等过滤规则的配置,iMC服务器使用UDP 162端口接收设备发送的Trap报文,要保证这个端口能正常通信。
5.检查服务器端口监听
如果iMC服务器上抓包能够抓到Trap报文,证明设备发送的报文已经成功到达iMC服务器。此时如果iMC还是无法接收则有可能是iMC服务器告警后台端口没有正常监听或者iMC服务器本身的防火墙过滤报文导致。
(0)
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论