• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

某局点 S12504X-AF DRNI环境OSPF震荡问题

  • 0关注
  • 0收藏 1746浏览
倪民 八段
粉丝:13人 关注:0人

组网及说明

现场S12504X-AF作为EOR,构建DRNI,下面的TOR是S6900,也构建DRNI



问题描述

现场对S12504X-AF做如下操作,均会导致EOR和PL服务器之间的OSPF震荡。

(1)震荡部分IPP成员口,恢复过程中有OSPF震荡。 

(2)震荡DR口,恢复过程中有ospf震荡。 

(3)重启一个单板,恢复过程中有OSPF震荡。 

过程分析

1、在分析TOR过程中发现,在故障瞬间,震荡节点对应的mac地址在TOR上有飘移,从BAGG1飘移到BAGG50,然后又飘回BAGG1。BAGG1是连接服务器的DR口,BAGG50是上联EOR的DR口。说明在震荡过程中,有这个地址的报文从EOR上进来。

2、抓包也确实看到了故障时有少量报文从EOR下来,理论上DR口成员之间隔离,从DR进入S12504X-AF后不会再发回给EOR设备。

3、以PL8为例,PL8的源MAC正常要学到BAGG1上的,PL8发送的报文以及组播报文均是从TOR3-1上送

4、组播报文从TOR 3-2上联EOR的DR口收到,造成TOR3-2 上的PL8 MAC迁移,学到了BAGG 50上, 此时有发向PL8的OSPF心跳报文,从TOR3-2进入,就会引起心跳报文丢包,因为此时TOR3-2是存在MAC表项的,但指向源端口,因此丢弃

5、此时TOR3-2由于产生MAC迁移,会同步给TOR3-1

6、TOR3-1收到同步报文,会产生迁移,但同时也有报文不断触发MAC学习到正确的BAGG1端口的报文,针对这种快速迁移,此时TOR处理逻辑有问题,就没有再同步给TOR3-2

7、TOR3-2没有收到MAC同步报文,并且BAGG1上也收不到来自PL8源MAC的报文,就会长时间出于故障状态, 一直等到TOR3-1间隔5分钟的定时同步,才将错误状态恢复,因此转发故障时间持续0—5min不等。 

8、在实验环境中,通过在EOR下发qos阻断mac迁移。将所有测试环境服务器上线后,对所有测试例进行逐一反复测试,均不再出现异常。 测试例包括但不限于:

(1) TOR的DR口震荡、IPP震荡、KEEPALIVE震荡、重启单机;

(2) EOR的DR口震荡、IPP震荡、KEEPALIVE震荡、重启单板、重启单机。 

解决方法

针对本次问题,简化分析描述如下: 

1、 EOR上端口震荡或者单板重启,引发瞬间隔离失效。PL发的广播报文按照标红路线转发1-2个包,导致PL的MAC学习到TOR上行接口BAGG50 

2、 这时正常转发流量如果要从EOR-----TOR3-2---PL转发,流量到了TOR3-2,会因为PL的MAC学习到上行口BAGG50,因此无法正常转发至PL,而流量又再次回到EOR,引起流量成环,最终导致丢包。 

3、 因为环境中PL的探测报文是实时都有去往TOR的,因此正常应该瞬间就又切回到BAGG1,但是由于69存在软件问题,导致MAC短时间内无法正常切回到BAGG1上,导致长时间断流(5分钟以内不等) 

4、 因此问题触发原因是125的性能问题导致瞬间隔离失效,引发弹包,导致TOR上MAC学习错误。但是决定丢包时间长短的因素,是取决于TOR(6900)的MAC迁移时间长短。 

5、 结合现网环境和服务器的心跳机制,如果6900的MAC迁移时长不超过服务器心跳超时时间(5S),那影响的范围就是个别流量的短暂丢包。而不会引起服务器心跳超时reset引起大范围故障。 

6、 比如MAC迁移从BAGG 50迁移到BAGG1耗费了1秒,那丢包时长就是1秒,影响有限。

从前面的分析看,由于EOR端口震荡,隔离表项下发性能问题,导致报文从DR口漏包给TOR设备;又触发了TOR设备mac迁移时间长的问题,造成长时间影响。 

解决方案: 

1、S6900设备的mac迁移问题,可以打上新的补丁解决; 

2、S125上后续发布新版本解决漏包问题。 

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

作者在2021-12-14对此案例进行了修订
0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作