S7500E/S10500交换机如何搜集辅助CPU的相关信息
一、 组网:
无
二、 问题描述:
对于S7500E和10500等产品,新交付件中含大量的多核引擎和业务板,之前对于辅助CPU的定位手段几乎没有,因此当辅助CPU出现问题后,给现场收集信息和定位都造成很大的困难,S663X/S113X版本以后,软件支持对辅助CPU收集部分关键信息。
引擎板、业务板上的服务CPU提供了对部分协议更好的支持,比如BFD协议的快速检测,RRPP协议的快速收敛等均依赖于辅助CPU。
三、 解决方法:
在收集信息之前,首先要解决定位到辅助CPU的位置,因为大多数命令行仍是以槽位号为参数的,辅助CPU只有逻辑槽位号的概念,通过display device实际上看不到辅助CPU对应的槽位,在这里主要是使用了IPC node ID,只要找到了辅助CPU对应IPC节点ID,就可以直接ID号收集信息。有几个常用的命令和识别方法:
举例:测试环境中,有如下设备:
[H3C-diagnose]display device
Slot No. Brd Type Brd Status Subslot Num Sft Ver Patch Ver
0 LSQ1SRPD Master 0 S7500E-6635 None
1 NONE Absent 0 NONE None
2 LSQ1GP24TXEB Normal 0 S7500E-6635 None
3 NONE Absent 0 NONE None
4 NONE Absent 0 NONE None
5 LSQ1NSMSC0 Normal 0 S7500E-6635 None
6 NONE Absent 0 NONE None
7 LSQ1FV48SA Normal 0 S7500E-6635 None
查看IPC节点信息
display ipc node
[H3C-diagnose]dis ipc node
Self node ID: 0
Current active node ID: 0, 2, 5, 7, 122
物理槽位与IPC节点ID是一一对应的,堆叠后会给每个框预留,具体算法和槽位号的算法相同,这里关注的是ID大于70的,因为无论单机还是堆叠模式,辅助CPU的节点ID都是放在最后,以上面为例,如果0、2、5、7槽位都是多核单板,则辅助CPU的节点ID从120开始编号,0槽对应120,依此类推,这个例子辅助CPU节点ID就是从120开始编号的,某些版本从72开始,版本不同要仔细分辨。查找的原则就是从大的节点ID开始找,凡与物理槽位不能对应且编号很大的ID都是辅助CPU的节点。找到节点ID后,下面命令不带CPU ID的都以这个NODE ID代替槽位号。
1、某槽位DDRB信息
既local logbuffer记录,命令行不变,槽位号输入辅助CPU的节点ID。
[H3C-diagnose]local logbuffer 122 display
2、某槽位CPU占用情况
辅助CPU对应的CPU ID 是1,主CPU对应的是0。
[H3C-diagnose]display cpu slot 2 cpu 1
3、某槽位内存占用情况
[H3C-diagnose]display memory slot 2 cpu 1
4、 某槽位内存明细
[H3C-hidecmd]_display memory slot 2 cpu 1
5、 某槽位CPU任务情况
[H3C-hidecmd]display task slot 2 cpu 1
6、 某槽位异步收集任务
[H3C-diagnose]_display task-info slot 122
7、 某槽位任务栈信息
[H3C-diagnose]_display task-track RECV slot 122
如存在辅助CPU的其他问题,请联系产品线处理