S8500产品主控板CPU利用率过高问题处理方法
图1 主控板CPU占用率过高故障处理流程
二、 故障处理步骤
1)步骤1
使用命令display cpu slot连续查询主控板CPU的占用率,确定主控板的CPU占用率是否异常。
如果主控板CPU占用率持续在40%以上,说明CPU有异常任务在处理,需要确认CPU高的具体原因,请转步骤2。
注意:在通过TELNET方式登录使用display diagnostic-information收集诊断信息时,查询结果会显示CPU占用率较高,此时需要在信息收集完毕后,等待一段时间再查询相关槽位的CPU占用率,确定是由于收集诊断信息导致的CPU占用率升高还是任务异常导致的CPU占用率升高。
2)步骤2
使用命令_system-monitor监控并查询主控板CPU各个任务运行情况。下面以S8512为例查询6号槽位任务运行情况:
打开调试开关,进入隐含模式
<S8500>terminal debugging
Current terminal debugging is on
<S8500>terminal monitor
Current terminal monitor is on
<S8500>sys
[S8500]_
[S8500-hidecmd]
打开监控开关,监控5秒后关闭监控开关,并查询指定槽位单板的任务信息
[S8500-hidecmd]_system-monitor start
[S8500-hidecmd]_system-monitor stop
[S8500-hidecmd]_system-monitor print 6
[S8500-hidecmd]
*0.339378352 S8500 DRVL2/8/DBG_DBG:
Total Monitoring time 2604 ms
Task Name Max Run(ms) Max Pend(ms) Running(ms) Percent(%)
---------------------------------------------------
co0 0 0 0 0.00
WEIL 9 4 2193 44.21
SYST 1 11 12 0.46
XMON 0 0 0 0.00
IPCQ 1 101 5 0.19
RPCQ 1 11 20 0.76
MDCT 1 21 7 0.26
MDCR 0 0 0 0.00
VP 0 0 0 0.00
EXCT 0 0 0 0.00
VFS 0 0 0 0.00
CBU 0 0 0 0.00
STND 0 0 0 0.00
co0 27 202 28 1.07
*0.339378957 S8500 DRVL2/8/DBG_DBG:
INFO 1 2 1 0.03
LDP 0 0 0 0.00
LAGT 0 0 0 0.00
ROUT 0 102 0 0.00
FIB 0 0 0 0.00
SOCK 1 203 1 40.03
VMON 0 0 0 0.00
VTYD 1 102 2 0.07
RSA 0 0 0 0.00
TAC 0 102 0 0.00
SC 0 102 0 0.00
RDSO 0 0 0 0.00
RDS 1 102 2 0.07
ACM 0 102 0 0.00
LSSO 0 1010 0 0.00
LS 0 0 0 0.00
TNLM 0 0 0 0.00
AGNT 0 0 0 0.00
TRAP 0 0 0 0.00
HABP 0 992 0 0.00
MDMT 0 0 0 0.00
*0.339379564 S8500 DRVL2/8/DBG_DBG:
NTPT 1 12 33 1.26
CFM 0 0 0 0.00
HS2M 0 529 0 0.00
LSPM 1 101 21 0.80
L2V 0 0 0 0.00
DT1X 1 102 1 0.03
MPM 0 0 0 0.00
MCAS 1 12 20 0.76
VRRP 1 1226 1 0.03
DEV 1 132 4 0.15
VLAN 1 101 3 0.11
LINK 1 1000 1 0.03
MSTP 0 1000 0 0.00
RMON 0 1000 0 0.00
HgpS 0 1000 0 0.00
HACH 0 0 0 0.00
HAND 1 10 150 5.76
MHND 0 1010 0 0.00
NMRV 1 12 14 0.53
*0.339380150 S8500 DRVL2/8/DBG_DBG:
RCVP 1 11 13 0.49
L2ST 1 12 21 0.80
L2Ma 0 0 0 0.00
L2PS 1 1010 3 0.11
DL3 1 52 16 0.61
DIAG 0 1010 0 0.00
L3MC 1 12 30 1.15
NDP 0 0 0 0.00
HVRP 1 1000 1 0.03
DARP 0 0 0 0.00
PARP 0 0 0 0.00
HOT 1 102 1 0.03
3)步骤3
根据步骤2的查询结果,进行故障分析。
在显示的任务信息中,最后一列显示该任务占用CPU的比率,其中有个WEIL任务比较特殊,是CPU的空闲任务,越高表明CPU越空闲。其他任务如果占用CPU比率太高,说明该任务运行不正常。
下面介绍一些常见导致主控板CPU高的任务及处理方法:
SOCK,收包处理任务。该任务占用率高,说明CPU收到大量协议报文并进行处理,可能是IP报文攻击导致,如果该任务占用率较高且某块接口板CPU也较高,则可能存在攻击,需要结合接口板进行分析;
RPCQ,板间通讯任务。该任务和SOCK任务可以结合在一起分析,如果收到大量报文且需要响应,该任务占用率会比较高,可能是受到IP报文攻击导致;
ROUT,路由模块处理任务。大路由学习或者路由振荡时,该任务占用率较高,此时需要查询相关路由信息确定路由模块是否存在问题。
L2ST和L2Ma,都是MAC地址同步和处理任务。多块接口板同时大量学习MAC地址时,该任务占用率比较高。如果网络中出现环路,导致MAC地址不断变迁,上述任务也会比较繁忙。
4)步骤4
如果无法确定任务占用率高属于正常现象还是存在异常,请联系800进一步处理。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作