• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索
  • 1关注
  • 0收藏 1095浏览
丁犁 八段
粉丝:83人 关注:1人

组网及说明

H3C 分布式交换机,及框式交换机,通过业务单板接口 XG5/0/1 与 网管监控平台互联,客户需要通过网管监控平台了解交换机运行情况。

当交换机出现掉电冷重启,或手动执行reboot命令热重启时,交换机在重启完毕后,会主动发送相关SNMP Trap消息(hh3cSysColdStartTrap 1.3.6.1.4.1.25506.6.8.4 或 hh3cSysWarmStartTrap  1.3.6.1.4.1.25506.6.8.5)通知网管监控平台,其存在重启启动情况。




问题描述

测试发现,当管理员执行reboot命令重启交换机时,网管监控平台随机性的无法接收到相关SNMP Trap消息。

及,多次执行reboot命令,热重启设备时,监控平台仅一、两次能收到 hh3cSysWarmStartTrap 1.3.6.1.4.1.25506.6.8.5 设备热启动消息。但每次执行reboot命令时,监控平台均能收到 hh3cRebootSendTrap 1.3.6.1.4.1.25506.6.8.3 设备即将重启事件告警消息。



过程分析

通过问题现象,可基本确认:

  • 交换机与网管监控平台网络连通性正常——因为:每次重启时,监控平台均能收到 hh3cRebootSendTrap 1.3.6.1.4.1.25506.6.8.3 设备即将重启事件告警消息。


那么判断问题的关键,就在于明确,交换机重启后,是否有发送出相关SNMP Trap消息。及,是交换机没有发送出相关SNMP报文,还是发出后监控平台处理判断异常导致。


通过在交换机上开启相关trap日志打印信息https://zhiliao.h3c.com/Theme/details/77395),发现交换机每次reboot重启后,交换机SNMP模块已发送相关Trap信息,并打印日志消息:

%Jun 27 18:47:01:382 2023 S12508X-AF SNMP/6/SNMP_NOTIFY: Notification hh3cSysWarmStartTrap(1.3.6.1.4.1.25506.6.8.5) with hh3cSysFirstTrapTime(1.3.6.1.4.1.25506.6.11.10.0)=54459.


虽然交换机上已经存在上述相关日志信息,但通过对业务接口 XG 5/0/1 镜像抓包,发现当监控平台无法收到SNMP消息时,交换机对应接口并没有发送对应的SNMP Trap消息。


为何产生如上情况呢?这里我们就需要了解分布式设备在启动时,硬件启动的先后顺序。


H3C Comware V7 平台分布式交换机,其硬件启动按照:主控板——>网板——>业务板 ,先后顺序进行启动加载。


结合此案例中的情况,及:

S12508X-AF设备,采用业务单板接口 XG 5/0/1 与监控平台互联。

  1. 设备重启后,主控板先重启成功,此时主控板CPU先发送相关SNMP Trap消息(日志中打印的相关hh3cSysWarmStartTrap信息)通知SNMP Server监控平台。
  2. 但相关网板、业务单板存在并未注册加载成功的情况。及此时,业务单板的XG 5/0/1接口,此时还无法正常工作,无法将报文发送出去。
  3. 因此,交换机只能相关相关SNMP Trap缓存起来,待XG5/0/1接口可正常工作时,再将前期缓存的Trap信息发送。
  4. 在缓存的过程中,设备仍会产生其他大量日志信息,这样就会导致相关hh3cSysWarmStartTrap信息概率性,被覆盖或丢弃,造成后续无法从设备XG5/0/1接口送出。 




就如同上图所示,对于启动后的交换机,Master主控板启动完成发送相关SNMP Trap,但只有当相关Slot11、12、13、14网板和Slot5业务单板都注册加载完成后,主控板CPU发送出的SNMP Trap消息,才会选择的路径,将报文传递给Slot 5业务单板,进而由可正常工作的XG5/0/1接口发出。


对于每次执行reboot命令时,监控平台均能收到 hh3cRebootSendTrap 1.3.6.1.4.1.25506.6.8.3 设备即将重启事件告警消息。该消息是在交换机重启前,交换机发出的。此时网板、业务单板均注册加载正常,因此对应的SNMP Trap可及时送出。这与交换机重启后,再发送的hh3cSysColdStartTrap或hh3cSysWarmStartTrap消息存在本质上的差异。



解决方法


通过上述分析说明,对于此类问题解决的关键核心,就是在主控板启动完成后,要求设备(交换机)及时将SNMP报文发出,尽快减少被缓存丢弃的概率

因此,解决方案为:调整交换机与监控平台的互联接口。及,不使用业务单板Slot 5上的接口,切换为主控单板上的M-GigabitEthernet接口。相关M-GigabitEthernet接口与主控板CPU内部直连,可快速将主控板CPU产生的SNMP消息(或其他协议报文)转发出去。


补充:

部分局点,若无法及时快速的切换互联链路,及仍然使用业务单板的接口作为与监控平台互联口,交换机提供如下优化命令,通过增大相关参数数值,加大设备对于SNMP消息的缓存能力,减少丢弃率。但注意,相关命令仅能启动优化作用,无法保障设备重启后100%不丢弃SNMP Trap消息。


    开启存活Trap周期发送功能,并配置发送时间间隔。

     snmp-agent trap periodical-interval interval

     缺省情况下,存活Trap周期发送的时间间隔为60秒。取值范围为0或者10~3600,单位为秒

    

    配置告警信息发送队列的长度。

     snmp-agent trap queue-size size

     缺省情况下,告警信息的消息队列最多可以存储100条告警信息。取值范围1~1000

    

    配置告警信息的保存时间。

     snmp-agent trap life seconds

     缺省情况下,告警信息的保存时间为120秒。取值范围为1~2592000,单位为秒



该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

作者在2023-06-29对此案例进行了修订
0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作