• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

某局点S6800挂死问题

  • 0关注
  • 0收藏 536浏览
粉丝:29人 关注:3人

组网及说明

/

告警信息

/

问题描述

73010:00分左右,现场有一组S6800-54QF堆叠设备异常挂死,分别掉电重启后恢复(先掉电重启slot2,恢复后掉电重启的slot1)。

<HN-GZNSD201-CB5-S6800-190.Int>dis version

H3C Comware Software, Version 7.1.045, Feature 2426

Copyright (c) 2004-2016 Hangzhou H3C Tech. Co., Ltd. All rights reserved.

H3C S6800-54QF uptime is 0 weeks, 0 days, 1 hour, 18 minutes

Last reboot reason : Cold reboot

 

Boot image: flash:/s6800-cmw710-boot-f2426.bin

Boot image version: 7.1.045, Feature 2426

  Compiled Jan 19 2016 16:00:00

System image: flash:/s6800-cmw710-system-f2426.bin

System image version: 7.1.045, Feature 2426

  Compiled Jan 19 2016 16:00:00

Patch image(s) list:

  flash:/s6800-cmw710-boot-patch-f2426h03.bin, version: Feature 2426H03

    Compiled Jan 19 2016 16:00:00

  flash:/s6800-cmw710-system-patch-f2426h06.bin, version: Feature 2426H06

    Compiled Jan 19 2016 16:00:00

 

Slot 1:

Uptime is 0 weeks,0 days,0 hours,50 minutes

S6800-54QF with 2 Processors

BOARD TYPE:         S6800-54QF

DRAM:               2048M bytes

FLASH:              512M bytes

PCB 1 Version:      VER.A

Bootrom Version:    150

CPLD 1 Version:     001

CPLD 2 Version:     001

Release Version:    H3C S6800-54QF-2426

Patch Version  :    Feature 2426H06

Reboot Cause  :     ColdReboot

[SubSlot 0] 48SFP Plus+6QSFP Plus

 

Slot 2:

Uptime is 0 weeks,0 days,1 hour,18 minutes

S6800-54QF with 2 Processors

BOARD TYPE:         S6800-54QF

DRAM:               2048M bytes

FLASH:              512M bytes

PCB 1 Version:      VER.A

Bootrom Version:    150

CPLD 1 Version:     001

CPLD 2 Version:     001

Release Version:    H3C S6800-54QF-2426

Patch Version  :    Feature 2426H06

Reboot Cause  :     ColdReboot

[SubSlot 0] 48SFP Plus+6QSFP Plus

过程分析

Slot1 cpu挂死后掉电重启,看不到相关的信息记录了。

但是从slot2的日志看,可以确认slot1 cpu故障挂死后,堆叠心跳报文超时,堆叠分裂后,slot2升级为master,但是因为早期版本不支持健康度检查,只能将框号大的slot2设备mad down,仅剩slot1承载业务,但由于slot1已经挂死,导致下挂业务全部中断。

%@1653%Jul 30 10:42:47:907 2023 HN-GZNSD201-CB5-S6800-190.Int HA/5/HA_STANDBY_TO_MASTER: Standby board in slot 2 changed to master.

%@1654%Jul 30 10:42:48:207 2023 HN-GZNSD201-CB5-S6800-190.Int DEV/3/BOARD_REMOVED: Board was removed from slot 1, type is S6800-54QF.

%@1655%Jul 30 10:42:48:733 2023 HN-GZNSD201-CB5-S6800-190.Int LAGG/6/LAGG_INACTIVE_PHYSTATE: Member port XGE1/0/3 of aggregation group BAGG3 changed to the inactive state, because the physical state of the port is down.

%@1656%Jul 30 10:42:48:756 2023 HN-GZNSD201-CB5-S6800-190.Int LAGG/6/LAGG_ACTIVE: Member port XGE2/0/11 of aggregation group BAGG11 changed to the active state.

%@1657%Jul 30 10:42:48:756 2023 HN-GZNSD201-CB5-S6800-190.Int LAGG/6/LAGG_INACTIVE_CONFIGURATION: Member port XGE1/0/11 of aggregation group BAGG11 changed to the inactive state, because the aggregation configuration of the port is incorrect.

%@1658%Jul 30 10:42:48:773 2023 HN-GZNSD201-CB5-S6800-190.Int LAGG/6/LAGG_INACTIVE_PHYSTATE: Member port XGE1/0/15 of aggregation group BAGG15 changed to the inactive state, because the physical state of the port is down.

%@1659%Jul 30 10:42:48:806 2023 HN-GZNSD201-CB5-S6800-190.Int LAGG/6/LAGG_INACTIVE_PHYSTATE: Member port XGE1/0/34 of aggregation group BAGG34 changed to the inactive state, because the physical state of the port is down.

%@1660%Jul 30 10:42:49:267 2023 HN-GZNSD201-CB5-S6800-190.Int BFD/5/BFD_CHANGE_FSM: Sess[192.168.0.2/192.168.0.1, LD/RD:97/97, Interface:Vlan2, SessType:Ctrl, LinkType:INET], Sta: DOWN->UP, Diag: 0

%@1661%Jul 30 10:42:49:269 2023 HN-GZNSD201-CB5-S6800-190.Int DEV/1/MAD_DETECT: Multi-active devices detected, please fix it.

 

综上,slot1 cpu硬件故障导致堆叠分裂,同时MADslot2 隔离导致业务受损。后续研发发布补丁支持健康度检查,再次发生故障可以将故障设备MAD DOWN隔离,确保健康的设备继续承载业务。

解决方法

更换slot1设备,打上支持健康检查的补丁。

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作