H3C S7506E V5 部分 display 命令卡顿延迟、无回显故障排查
一、先梳理你现场现象
正常命令:dis cpu、dis cu、查看配置完整输出流畅;
卡顿异常命令:dis link-aggregation verbose、dis version、dis vlan、dis logbuffer,执行后停顿 4~5 秒,甚至直接无输出;
设备型号 S7506E,Comware V5 平台。
二、核心根因(V5 框式交换机高频故障)
1. 主控 / 业务板 CPU 采集阻塞(最高概率)
dis cpu只输出整机 CPU 占用,但V5 中查看链路聚合、VLAN、版本、日志需要主控向所有业务槽位下发采集报文,若某块业务板卡 CPU 卡死、板卡通信异常,主控等待板卡应答就会出现长时间等待,超时后直接截断输出,表现为 “卡几秒无回显”。
从你截图看 Slot0/2/3 CPU 仅 3%~4%,但Slot1 业务板状态未知,大概率 Slot1 单板异常、板间通信拥塞。
2. LACP 聚合成员端口状态遍历开销过大
Bridge-Aggregation50 为动态 LACP 聚合,执行dis link-aggregation verbose会逐个读取所有成员端口 LACP 协商状态、远端设备信息;如果对端设备 LACP 报文交互异常、协商超时,本地遍历端口时会等待定时器,造成命令卡顿。
3. 设备缓存 / 日志缓冲区溢出
dis logbuffer、dis vlan依赖本地日志、VLAN 数据库缓存,V5 长期运行未清理日志,缓冲区占满会导致读取命令阻塞。
4. 终端分页缓存兼容问题(次要)
超级终端 / CRT 终端分页长度screen-length配置异常,读取大表项时终端交互等待,但你dis cu正常,此可能性偏低。
三、分步排查处理(按优先级)
步骤 1:排查所有业务板卡运行状态,定位异常单板
plaintext
# 查看所有槽位单板在位、运行状态
display device
# 查看各单板详细运行、故障告警
display device verbose
# 查看单板之间内部通信报文统计,看是否丢包
display device inter-chassis packet
重点观察:
Slot1 板卡是否显示Fault、Offline、Running abnormal;
板间报文是否大量丢包,丢包即板卡通道阻塞。
修复:
若某单板异常:机房断电拔出该业务板,重新插拔复位;无法恢复则更换同型号业务板。
临时规避:故障单板下所有接口 shutdown,再执行 dis 命令,卡顿消失即确认该板故障。
步骤 2:优化 LACP 聚合,消除链路聚合查询卡顿
查看聚合端口协商状态,定位异常成员口
plaintext
display link-aggregation summary
display lacp neighbor
对协商异常、频繁 flapping 的端口,检查对端配置是否同为 dynamic 动态聚合、VLAN 允许列表是否一致;
临时简化查询,不加 verbose 快速验证:
plaintext
# 无详细遍历,秒回显
display link-aggregation summary
# 卡顿消失=verbose遍历成员端口导致延迟
优化 LACP 超时,减少等待时长:
plaintext
interface GigabitEthernet1/6/0/7
lacp timeout fast
步骤 3:清理溢出日志缓存,解决 dis logbuffer/dis vlan 卡顿
plaintext
# 清空设备本地日志缓存,释放读取资源
reset logbuffer
# 关闭冗余日志打印,降低数据库负载
info-center source default filter severity informational
# 限制日志存储条数
info-center logbuffer size 1024
步骤 4:调整终端分页参数,排除交互等待
plaintext
system-view
user-interface aux 0
screen-length disable
user-interface vty 0 15
screen-length disable
关闭分页后,设备一次性输出全部内容,避免终端分页交互等待延迟。
步骤 5:升级 / 重启主控兜底修复
临时重启主控释放异常进程(业务短时中断)
plaintext
reboot
长期根治:S7506E V5 老旧版本存在板卡采集进程 BUG,升级至官方稳定基线版本(V5.70 Release 6308P20 及以上),修复多槽位数据采集阻塞缺陷。
四、快速验证定位方法
只保留正常业务板,shutdown 其余槽位接口,执行dis link-aggregation verbose:
恢复流畅 = 某块业务板硬件 / 进程异常;
清空日志后dis vlan秒出 = 日志缓冲区溢出;
执行dis link-aggregation summary不卡、带 verbose 卡 = LACP 成员端口协商遍历耗时。
五、补充区分你现场正常 / 异常命令原理
display current-configuration:仅读取主控本地配置文件,无需和业务板交互,所以永远流畅;
display cpu:仅读取主控自身 CPU 统计,不轮询全槽位,输出快;
dis vlan/dis link-aggregation verbose/dis version/dis logbuffer:主控需要和全部业务槽位交互采集数据,任意一块单板响应异常就会卡顿、无回显。
暂无评论
display 命令时出现卡顿且无回显的问题,结合网络设备的底层运行机制,这通常是由于设备 CPU 负载过高、系统进程阻塞或日志中心(info-center)资源占用异常引起的。dis cu)正常,说明基本的命令行交互通道没有问题,但涉及硬件状态查询(如链路聚合)、系统信息(如版本、CPU)的命令需要调用更底层的驱动或进程。请重点排查以下几点:display cpu-usage 和 display memory 命令。undo info-center enabledisplay device 确认主控板状态是否为 Master/Slave 正常。如果是双主控架构,建议切换到主用主控后再执行查看命令。display diagnostic-information 命令收集完整的诊断信息并保存至本地文件。暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论