• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

H3C ACG1040,无法引导 Kernel panic - not syncing

3天前提问
  • 0关注
  • 0收藏,68浏览
LianXC 二段
粉丝:0人 关注:0人

问题描述:

你好,我有一台ACG1040,机房搬迁,断电再开机,无法引导进系统,提示,

INFO: task sync:1271 blocked for more than 120 seconds.

Kernel panic - not syncing: hung_task: blocked tasks

设备反复自动重启,请教是硬件问题,还是软件问题,有何处理方法。谢谢

 

 

引导过程详细日志

[11:01:36]/sbin/rc starting

[11:01:36]Mounting file systems

[11:01:36]Setting up loopback

[11:02:07]fsck.fat 3.0.26 (2014-03-07)

[11:02:07]Starting check/repair pass.

[11:02:08]Starting verification pass.

[11:02:08]/dev/sda1: 162 files, 16068/62396 clusters

[11:02:21]log disk part is sdb1.

[11:03:47]

[11:03:47]

[11:05:22]

[11:05:22]

[11:05:30]

[11:05:30]

[11:05:30]

[11:06:09]

[11:06:09]

[11:06:10]

[11:06:10]

[11:06:11]

[11:06:15]

[11:06:15]

[11:06:15]

[11:06:59]

[11:06:59]

[11:06:59]

[11:07:00]

[11:07:34][  429.576975] INFO: task sync:1271 blocked for more than 120 seconds.

[11:07:34][  429.652117] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.

[11:07:34][  429.745994] sync            D ffffffff80756ffc     0  1271   1268 0x00100000

[11:07:34][  429.830778] Stack : 800000007e06b980 ffffffff8020bc84 ffffffff8097ac80 ffffffff8024b0dc

[11:07:34]          800000007e01d5f8 0000000000000103 000000fff2b8731c 80000004161ea080

[11:07:34]          0000001050918001 800000007e01d5f8 8000000063405f50 00000000f2b8731c

[11:07:34]          800000007e01d5f8 ffffffff8022bf08 00000028857c0a90 0000000000000103

[11:07:34]          000000fff2b87000 8000000063405f50 80000004161ea080 0000000000000000

[11:07:34]          0000000000000000 0000000000000000 0000001050918001 ffffffff8024b0dc

[11:07:35]          0000000000000000 800000007e01d5f8 800000007e020c38 80000004161ea080

[11:07:35]          000000fff2b8731c ffffffff8097ac80 800000007e0a2ca8 800000007e01d5f8

[11:07:35]          ffffffff8097ac80 ffffffff8022f110 0000000000000000 ffffffff855e2000

[11:07:35]          800000007e053788 8000000419fe39e0 80000004161ea080 80000000632b0330

[11:07:35]          ...

[11:07:35][  430.618315] Call Trace:

[11:07:35][  430.647682] [<ffffffff80756ce8>] __schedule+0x448/0x678

[11:07:35][  430.710371] [<ffffffff80756ffc>] schedule+0x3c/0xb8

[11:07:35][  430.768941] [<ffffffff80755a90>] schedule_timeout+0x168/0x1c0

[11:07:35][  430.837915] [<ffffffff807567ac>] wait_for_common+0x114/0x168

[11:07:35][  430.905829] [<ffffffff80285da8>] sync_inodes_sb+0xb0/0x210

[11:07:35][  430.971667] [<ffffffff8025fea0>] iterate_supers+0x140/0x148

[11:07:35][  431.038527] [<ffffffff8028afd8>] sys_sync+0x38/0xa8

[11:07:35][  431.097058] [<ffffffff80180604>] handle_sys64+0x44/0x68

[11:07:35][  431.159740] 

[11:07:35][  431.177645] Kernel panic - not syncing: hung_task: blocked tasks

[11:08:05]

[11:08:05]*** NMI Watchdog interrupt on Core 0x01 ***

[11:08:05]        $0      0x0000000000000000      at      0x0000000010000ce0

[11:08:05]        v0      0xffffffff809f0000      v1      0x0000000000000000

[11:08:05]        a0      0xffffffff856b72f0      a1      0x0000000000000001

[11:08:05]        a2      0x0000000000000000      a3      0x69e1a20935bd10f7

[11:08:05]        a4      0x00000069e1a20935      a5      0x3030306430363031

[11:08:05]        a6      0x202843617669756d      a7      0x204f6374656f6e2b

[11:08:05]        t0      0x0000000000000001      t1      0xffffffff856bcea0

[11:08:05]        t2      0xffffffff857b0000      t3      0x0000000000000000

[11:08:05]        s0      0xffffffff809804b8      s1      0xffffffff808dc5d0

[11:08:05]        s2      0x0000000000000191      s3      0x00000000ee6b2800

[11:08:05]        s4      0x800000041e2579a0      s5      0x7fffffffffffffff

[11:08:05]        s6      0x0000000000000004      s7      0x0000000000000001

[11:08:05]        t8      0x0000000000000048      t9      0x0000000000000001

[11:08:05]        k0      0x0000000000000000      k1      0x0000000000000020

[11:08:05]        gp      0x800000041e254000      sp      0x800000041e257750

[11:08:05]        s8      0x0000005a569a2b76      ra      0xffffffff80750ef0

[11:08:05]        err_epc 0xffffffff8019c460      epc     0xffffffff801eb848

[11:08:05]        status  0x0000000010480ce4      cause   0x0000000000800808

[11:08:06]        sum0    0x0000000000000000      en0     0x0000000000000000

[11:08:06]*** Chip soft reset soon ***

[11:08:10]

[11:08:10]

[11:08:10]Bootloader V1.4(Build time: Jun 11 2014 - 14:52:43)

[11:08:10]

[11:08:11]board revision major:2, minor:0

[11:08:11]OCTEON CN5020-SCP pass 1.1, Core clock: 700 MHz, DDR clock: 199 MHz (398 Mhz data rate)

[11:08:11]

[11:08:11]WARNING:

[11:08:12]WARNING: Measured DDR clock mismatch! expected: 333 MHz, measured: 199 MHz, cpu clock: 700 MHz

[11:08:12]WARNING: Using measured clock for configuration.

[11:08:12]WARNING:

[11:08:12]

[11:08:12]DRAM:  2048 MB

[11:08:13]Flash:  4 MB

[11:08:14]Clearing DRAM........ done

[11:08:14]BIST check passed.

[11:08:14]Starting PCI

[11:08:14]PCI Status: PCI 32-bit

[11:08:14]PCI BAR 0: 0x00000000, PCI BAR 1: Memory 0x00000000  PCI 0xf8000000

[11:08:14]Net:   octeth0, octeth1, octeth2

[11:08:14] Bus 0 (CF Card): OK 

[11:08:14]

[11:08:15]  ide 0: Model: SMI MODEL Firm: 20111006 Ser#: 20090410    000003FA

[11:08:15]            Type: Removable Hard Disk

[11:08:15]            Capacity: 487.7 MB = 0.4 GB (998928 x 512)

[11:08:18]Press Ctrl+C to stop auto start : 0 

[11:08:18]Loading serial.no .reading serial.no

[11:08:18]

[11:08:18]** Unable to read "serial.no" from ide 0:1 **

[11:08:18]

[11:08:18]******** load serial.no failed

[11:08:18]Loading startup.cfg .reading startup.cfg

[11:08:18]

[11:08:18]Loading vmlinux.64 .reading vmlinux.64

[11:09:01]...............................................................................................

3 个回答

在保的话400  不在保的话难搞

暂无评论

粉丝:143人 关注:1人

从特征来看:

90% 可能是存储介质(CF卡)损坏

  • 设备的 /dev/sda1/dev/sdb1 都是嵌入式 Flash 存储或 CF 卡分区;

  • 日志中 fsck 已尝试修复 FAT 分区;

  • 随后 sync 操作超时、任务阻塞,说明内核在与存储交互时卡死;

  • 断电后再上电出现该问题,非常符合 CF 卡坏块或文件系统损坏 的特征。

10% 可能是内存/主板频率异常

  • DDR 时钟检测不符(333 MHz vs 实测 199 MHz);

  • 若此信息在以往启动时也出现过,则可忽略;

  • 若是首次出现,有可能主板老化,时钟参考不稳定;
    不过这种情况一般不会引起持续的“sync blocked”。

暂无评论

军刺 三段
粉丝:2人 关注:0人

根据你描述的现象和日志信息,设备无法引导的问题可能同时涉及硬件接触不良文件系统损坏,结合机房搬迁的背景,硬件接触问题的可能性更高。以下是具体分析和处理步骤:

一、问题核心分析

  1. 关键日志指向
    • 内核崩溃提示 task sync:1271 blocked for more than 120 seconds,说明 sync 进程(负责文件系统同步)长时间阻塞,通常因存储设备无响应导致。
    • 重启时 Bootloader 提示 DDR clock mismatch(DDR 时钟不匹配,预期 333MHz,实测 199MHz),可能是内存接触不良或硬件故障。
    • 无法读取 serial.no 从 ide 0:1,且存储设备(IDE 设备,可能是 CF 卡或硬盘)加载异常,暗示存储设备连接或自身故障。
  2. 诱因关联
    机房搬迁的震动可能导致内存、存储设备(如 CF 卡、硬盘)或 PCI 设备松动,进而引发硬件通信异常;同时,突然断电可能导致文件系统损坏,加剧引导失败。

二、处理步骤(按优先级排序)

1. 检查硬件连接(优先处理)

搬迁后硬件接触不良是最常见诱因,需逐一排查:
  • 内存(DDR)
    • 断电后打开设备机箱,找到 DDR 内存模块,拔出后用橡皮擦清洁金手指,重新插入并确保卡扣扣紧。
    • 目的:解决 DDR clock mismatch 问题(时钟异常通常因接触不良导致信号传输不稳定)。
  • 存储设备(IDE 设备)
    • 日志中提到 ide 0 设备(容量 0.4GB,可能是系统 CF 卡或硬盘),检查其数据接口和供电接口是否松动。
    • 重新插拔 IDE 设备(如 CF 卡、硬盘),确保连接牢固;若有备用存储设备,可临时替换测试是否为设备本身故障(如 CF 卡损坏)。
  • 其他硬件
    • 检查 PCI 卡(如有)、电源接口是否松动,确保无物理损坏。

2. 修复文件系统(若硬件连接正常后仍故障)

突然断电可能导致文件系统损坏,需手动检查修复:
  • 进入救援模式
    • 重启设备,在 Bootloader 阶段(提示 Press Ctrl+C to stop auto start 时)按 Ctrl+C 中断自动引导,进入 Bootloader 命令行。
    • 若支持救援模式,选择加载救援内核;若不支持,尝试通过 boot 命令指定单用户模式(如 boot vmlinux.64 single)。
  • 检查并修复分区
    • 识别系统分区:日志中提到 /dev/sda1(FAT 格式)和 sdb1(日志分区),需分别检查。
    • 执行修复命令:
      fsck.fat -y /dev/sda1 # 修复 FAT 分区(sda1) fsck.ext4 -y /dev/sdb1 # 若 sdb1 是 ext 格式,用对应工具修复(根据实际格式调整)
    • 注意:修复前若有重要数据,优先通过外接设备备份(如将存储设备挂载到其他机器)。

3. 恢复或升级固件(若上述步骤无效)

若文件系统修复后仍频繁 kernel panic,可能是系统固件损坏:
  • 通过 Bootloader 恢复固件
    • 从厂商获取 ACG1040 的官方固件(如 vmlinux.64 和 rootfs 镜像)。
    • 通过 TFTP 或 USB 设备在 Bootloader 阶段重新刷写固件(参考设备手册的固件恢复步骤)。
  • 检查硬件故障
    • 若多次恢复固件仍失败,或替换内存 / 存储设备后问题依旧,可能是主板、CPU 等核心硬件故障,需联系厂商维修。

三、总结

  • 优先排查硬件接触:内存和存储设备松动是搬迁后最可能的原因,重新插拔可解决多数问题。
  • 次选修复文件系统:断电导致的文件系统损坏需手动修复,避免因读写异常引发进程阻塞。
  • 最后考虑固件或硬件故障:若前两步无效,通过固件恢复或替换硬件进一步定位问题。
操作时注意断电操作,避免静电损坏设备;若缺乏硬件操作经验,建议联系厂商技术支持协助处理。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明