• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

中端交换机单板无法正常启动时基本排查方法

2013-10-31 发表
  • 0关注
  • 0收藏 2437浏览
张磊 九段
粉丝:26人 关注:0人

中端交换机单板无法正常启动时基本排查方法

一、   组网:

二、    问题描述:

单板故障属于最常见的问题,而且基本上以硬件故障居多,此类问题因涉及硬件,收集的信息中软件经常无法做到完全记录,处理方法以替换测试为主,只有少量问题能明确的从diag信息中直接定位,为避免反复收集信息,故整理该文档。通过一些基本的排查手段,部分问题可以直接快速定位,其余问题按照文档收集信息,也能大大减少分析和定位问题的时间。

三、过程分析:

单板无法启动,总结有如下几种情况:

一、最坏情况,单板插入后引擎没有任何反应,也没有加载日志。这种情况多以业务板故障居多,处理方法如下。

1、首先尽量证实新插入业务板是好的,比如换槽位或者插到其他设备上能否启动等。

2、看引擎上的进程是否正常,如果软件负责加载的进程异常,也会出现这个现象,如果是这样,设备上新插入的所有单板都会无法启动,可以根据这一点做初步判断。命令display task只看引擎即可,看系统进程中是否有suspend状态,如有,肯定有问题,第一时间收集[diagnose]_display task-track

命令举例:

系统视图下_h进入隐藏视图,然后执行display task

[H3C]_h

[H3C-hidecmd]display task

name    Tid Vid TSize Mod priority   Status  Total/Max/Last(Millsecs)

================================================================================

VFS 85b6ae00   1   40   N   100     queblock     0/    0/    0

CBU 85b6aa00   2   40   N   100     queblock     0/    0/    0

VIDL 85b6a800   3   40   P   1    preemptready 361522/ 9/    0

TICK 85b6a600   4   40   P   250  preemptready  1194/  0/    0

STMR 85b6a400   5   40   N   150    eventblock   219/  0/    0

dGDB 85b6a200   6   40   N   180    eventblock    0/   0/    0

RECV 85b6a000   7   39   N   216    semblock     234/  1/    0

系统视图下en_diag 进入诊断视图,然后收集相关suspend状态进程的堆栈信息,如VFS进程:

[H3C]en_diag

CAUTION : Now you enter a en_diag command view for developer's testing, some commands may be dangerous, please carefully use it with our engineer's direction.

[H3C-diagnose]_display task-track VFS

Task name               : VFS

Task PLAT Index         : 1

Task OS Index           : 0x85b6ae00

Task priority           : 100

Task Status             : queblock

Last run time(CPU Tick) : 0x0(high)  0x2ca2(low)

Max run time(CPU Tick)  : 0x0(high)  0x2ca2(low)

Total run time(CPU Tick): 0x0(high)  0x2ca2(low)

Stack Information:

  0x801d6770

  0x801da2d0

  0x801dbfc8

  0x81111f1c

  0x811026b0

  0x81101a0c

  0x811456c8

[H3C-diagnose]

3、以上排查没有问题,业务板接串口,先做一次内存测试;多数业务板故障在这时能够看到串口打印出的异常信息,这里除bootrom启动时打印的版本、自检以及加载启动等信息外都属于异常信息,尤其是含内存、调用栈的信息。如果内存检测失败,则可以确认为内存故障,需要返修相应的单板。业务板内存测试的方法:

Starting......      //系统启动过程中在此时按住“Ctrl+t

RAMLine.....OK    

RAMTest 256MByte ................OK     //此时显示“OK”说明内存没有问题,显示“ERROR”说明内存硬件故障需要返修 

 

二、另外一种情况,有加载但不能启动。这种情况系统日志和告警中都会有加载信息%Apr  2 03:31:53:065 2000 GAOCHUN_S7506E_1 DEV/4/LOAD FINISHED: Board has finished loading file on Chassis 0 Slot 2.

1、仍然先确保新插入业务板是否正常,同上。

2、再查引擎上的任务状态,同上。

3、查看日志及告警,看是否有不支持、不兼容等明显提示。如

Warning: The LPU board on slot 2 is not compatible with MPU board, its board type is 29.255.

This device do not support LSQ1IAGSC0 on slot 5!

Warning: VERSION V600R001xxxx does not support this epon board ! \r\n Please upgrade version  to after Release  6200

 

从第一种情况可以看到业务板和主控板类型不兼容,常见原因有76的业务板插在75E 机框上使用,75E的业务板插在76的机框上使用。关于业务板可以在何种机框使用,请参考官网上单板手册。

 

从第二种情况可以明显的看到是因为版本太低导致的单板不识别,需要升级版本解决。

4、业务板接串口、测试内存等,同上。

 

通过以上排查大多数问题都可以现场直接定位出来。如果还是无法定位问题,请反馈现场的测试过程及diag信息由二线来处理。

 

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

作者在2019-06-10对此案例进行了修订
0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作