• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

某局点S6825异常重启问题

2023-09-29 发表
  • 0关注
  • 0收藏 628浏览
粉丝:29人 关注:3人

组网及说明

/

告警信息

/

问题描述

两台堆叠slot2突然异常重启了,需要分析原因:

MPU(S) Slot 2:

Uptime is 0 weeks,0 days,4 hours,6 minutes

H3C S6825-54HF MPU(S) with 1 C3558 Processor(s)

BOARD TYPE:         S6825-54HF

DRAM:               4096M bytes

FLASH:              3616M bytes

NVRAM:              0K bytes

PCB 1 Version:      VER.A

PCB 2 Version:      VER.B

Basic    BootWare Version: 136

Extended BootWare Version: 136

CPLD 1 Version:     004

CPLD 2 Version:     002

CPLD 3 Version:     001

Release Version:    H3C S6825-54HF-6635

Patch Version:      None

Reboot Cause:       KernelAbnormalReboot

[SubSlot 0] 48SFP28 + 6QSFP28

过程分析

本次设备重启涉及微码问题,分析过程如下:

1.设备重启前报了invalid opcode无效的操作码,导致设备内核异常重启;

[787121.602685] 3:invalid opcode: 0000 [#1] SMP

[787121.602700] 3:Modules linked in: system(O) addon(O) driver(O)

[787121.602720] 3:CPU: 3 PID: 14134 Comm: bC.0 Tainted: G           O    4.4.65 #1

[787121.602738] 3:Hardware name: NONE C3000 Platform1/C3000 Platform1, BIOS 05.10.12.0027 10/26/2018

 

2.尝试翻译现场异常IP的汇编如下,在正常设备翻译soc_mem_field_get+0x118汇编流程如下,并没有+0x118(+280)的汇编偏移

   0x0000000000cbbcde <+270>:   add    $0x28,%rsp

   0x0000000000cbbce2 <+274>:   pop    %rbx

   0x0000000000cbbce3 <+275>:   pop    %r12

  0x0000000000cbbce5 <+277>:   pop    %r13

   0x0000000000cbbce7 <+279>:   pop    %r14

   0x0000000000cbbce9 <+281>:   pop    %r15//并没有偏移+280的汇编指令

   0x0000000000cbbceb <+283>:   pop    %rbp

   0x0000000000cbbcec <+284>:   retq

   0x0000000000cbbced <+285>:   nopl   (%rax)

   0x0000000000cbbcf0 <+288>:   mov    0x0(,%r12,8),%rax

   0x0000000000cbbcf8 <+296>:   mov    $0x0,%r8

 

3.现场dump出的代码段信息与正常设备的代码段一致,不存在差异,排除代码段导致的异常;

[787121.630417] 3:Code: 94 03 48 8b 40 48 4a 8b 34 e0 48 8b 55 c8 41 b9 14 00 00 00 4d 89 f8 44 89 f1 89 df e8 c2 e6 ff ff 48 83 c4 28 5b 41 5c 41 5d 41 <5e> 41 5f 5d c3 0f 1f 00 4a 8b 04 e5 a0 05 b3 a4 49 c7 c0 00 c8

 

正常设备的代码段:

(gdb) x/32xb 0x0000000000cbbce2

0xcbbce2 <soc_mem_field_get+274>:       0x5b    0x41    0x5c    0x41    0x5d    0x41    0x5e    0x41

0xcbbcea <soc_mem_field_get+282>:       0x5f    0x5d    0xc3    0x0f    0x1f    0x00    0x4a    0x8b

0xcbbcf2 <soc_mem_field_get+290>:       0x04    0xe5    0x00    0x00    0x00    0x00    0x49    0xc7

0xcbbcfa <soc_mem_field_get+298>:       0xc0    0x00    0x00    0x00    0x00    0x45    0x89    0xd9

 

综合来看,触发异常的原因是CPU执行汇编指令运行结果不符合预期,导致设备触发异常,涉及C3000 CPU微码指令执行出错的问题,建议安装最新的强补丁解决,合入了最新的微码版本;

解决方法

综合来看,触发异常的原因是CPU执行汇编指令运行结果不符合预期,导致设备触发异常,涉及C3000 CPU微码指令执行出错的问题,建议安装最新的强补丁解决,合入了最新的微码版本;

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作