不涉及
某局点ADCOMPUS 5.0方案,现场反馈SDN组网中所有的设备,通过带外口连接服务器,服务器开启mib-broswer读取设备信息时出现超时中断,读取传统网中同型号设备就不会超时中断
首先根据现场的描述,只要在SDN组网中设备都有问题,传统网没有问题,怀疑是不是SDN控制器和IMC网管系统占用snmp进程,导致mib-broswer通过oid节点访问设备时超时中断,故让现场将IMC和设备脱管,还是会出现mib-broswer读取设备信息中断,由于SDN控制器不允许有业务时和设备脱管,故咨询解决方案侧,解决方案反馈现场的SDN控制器2小时才会通过SNMP轮询设备一次,且现场是通过业务口和SDN控制器相连,mib-broswer服务器是连在设备管理口,后面让解决方案侧搭环境测试,也没有复现故障,排除SDN控制器影响。
然后在mib-broswer服务器和交换机之间在读取超时故障时抓包,同时在交换机上debugging snmp packet,发现超时中断时,在交换机上联设备的出端口抓包,看snmp 最后给交换机发了snmp request报文,但是交换机没有回复,在交换机上debugging snmp packet没有看到有最后一个snmp request报文处理信息,且之前的request报文在debugging中看都很快被处理且回复了response报文,说明没有处理时间超长的节点,由于交换机管理口报文直送CPU,如果送到CPU肯定会处理,肯定会在debugging中看到,按照现场的情况,说明超时中断时,request报文发到管理口了,但是没有到CPU,故怀疑是管理口丢包。
交换机上管理口对于上CPU报文限速800pps,超限速报文会被丢弃,防止上送CPU过多,故让现场再次抓包看下管理口收到的报文,在管理口对端二层交换机接口出方向抓包,发现有很多CPHA报文,现场反馈该报文是发到其他设备的,不应该发到这个设备,之前抓包由于只关注SNMP报文就忽略该报文,后来现场过滤掉CPHA报文后,故障消除。
管理口限速800pps,由于收到过多CPHA报文,导致管理口报文超限速,从而导致mib-broswer读取设备信息交互的snmp丢包,从而超时中断,过滤掉CPHA报文故障恢复。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作