• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

某局点S12500F 下挂leaf自动化上线上行口被识别为下行口问题

  • 0关注
  • 0收藏 653浏览
粉丝:29人 关注:3人

组网及说明

/

告警信息

/

问题描述

现场针对ADDC网络扩容,在823进行新增一台leaf S6800的操作,上线后发现leaf的上行口识别为computer,上线失败,后续在96日再尝试上线一台leaf S5560X-EI,故障现象一样。


明细现象如下:

823日新增扩容一台leaf(S6800-54QF),大约20:00leaf上线完成后,leaf5/0/49下发了正确的配置(连的是spine2),但1/0/49被识别为了下行口(连的是spine1),下发了错误的配置。查看自动化上线的日志,发现1/0/49口将对方spine1的角色识别为了computer

2011-01-01 08:03:35,923 topo.py[line:87] DEBUG [topology]--Notified--topology change {'FortyGigE1/0/49': {'add': [{'PeerIP': None, 'sysName': 'HTT003_SDN_SP_01', 'sysdesc': 'h3c', 'Loopback1IP': '0.0.0.0', 'mac': '7057-bff7-ee00', 'PeerIntf': 'FortyGigE1/3/0/6', 'role': 'computer', 'LoopbackIP': '12.99.254.254'}], 'del': [], 'mod': []}}

 

后续在96日再尝试上线一台leaf S5560X-EI,故障现象一样:

interface Ten-GigabitEthernet5/0/49

port link-mode bridge

port link-type trunk

port trunk permit vlan 1

lldp compliance admin-status cdp txrx

vtep access port

#

interface Ten-GigabitEthernet1/0/49

port link-mode bridge

过程分析

根据反馈的fabric.log日志,发现leaf侧对spine1的角色识别始终是错误的,但是对于spine2的识别就是正确的,因此初步怀疑是spine1的相关进程出现了异常,未能委托lldp帮忙发送相关信息,peerIProle始终为无效值可以进一步佐证:

2011-01-01 08:03:35,923 topo.py[line:87] DEBUG [topology]--Notified--topology change {'FortyGigE1/0/49': {'add': [{'PeerIP': None, 'sysName': 'HTT003_SDN_SP_01', 'sysdesc': 'h3c', 'Loopback1IP': '0.0.0.0', 'mac': '7057-bff7-ee00', 'PeerIntf': 'FortyGigE1/3/0/6', 'role': 'computer', 'LoopbackIP': '12.99.254.254'}], 'del': [], 'mod': []}}

通过现场抓包,对比Spineleaf的发包,进一步证实了Spine1设备无法委托lldp发送tlv信息:

故障spine1的抓包(无code 200tlv字段):


正常leaf的抓包(包含code 200tlv字段):


进一步远程登录设备确认设备进程状态,发现是lldp13槽位进程在之前打补丁的时候重启过,存在低概率的先后时序问题,导致vcf不感知,接口的代理注册信息丢失,没有办法能获取到了,从而导致委托发送携带信息失败。

 

整个问题逻辑如下:

设备角色的识别功能是基于VCF委托LLDP报文发送的时候在TLV字段携带角色信息,这个委托发送功能的实现是基于VCF要到LLDP进程注册。

H37补丁时会涉及所有板的lldp进程重启:

1Vcf在主控委托lldp代理,当lldp进程重启后,感知主控lldp本地lipc服务端口downup,会重新下发注册。

2LLDP收到委托代理后,会在lib侧将该消息发送到接口所在板。

3、委托lldp发送额外字段打印,无错误打印代表委托成功。委托过程调用的是lldp的接口,此时接口板lldp进程还未重启,注册成功了。

2022-08-17 20:13:53,444 topo_collect.py[line:778] DEBUG lldp_commit FortyGigE1/3/0/6

4再此之后,lldp13进程重启,此时vcf不感知,接口的代理注册信息丢失,没有办法能获取到了,从而导致委托发送携带信息失败。

 

进一步在实验室模拟复现,低概率复现了该问题。只有打补丁过程中符合了上面进程重启的时序才会复现问题。


综上,Spine设备在打H37补丁时,存在低概率时序问题,业务板的lldp进程重启晚于主控板,因此业务板VCF委托LLDP报文失败,无法携带TLV字段携带角色信息,导致上行口识别错误,现场通过重启LLDP进程已恢复,后续计划发布R2713H3701补丁解决。

解决方法

现场通过重启LLDP进程已恢复,后续计划发布R2713H3701补丁解决。

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作