不涉及
@63649%Oct 31 14:10:36:853 2023 xx DRVPLAT/2/DrvDebug: -Slot=3;
WARNING: Please check slot 3 Buffer! The buffer(6735, 0, 1) of chip 2 on slot 3 to port HGE3/0/1 is used up to 90%. The CoS field is 7.
%@268683%Jan 18 21:12:14:401 2024 xx DRVPLAT/2/DrvDebug: Slot=3;
WARNING: Please check slot 3 Buffer! The buffer(6602, 0, 2) of chip 2 on slot 3 to port HGE3/0/6 is used up to 90%. The CoS field is 2.
现网一台S12504X-AF设备日志中频繁打印buff不足告警
1.display counters rate interface查看设备上接口流量实际很小,不会因为业务流量太大导致拥塞告警
2.进一步分析诊断,发现是硬件检测报文发送时,发包中断没有上报,报文没成功发出去导致告警,具体如下:
如下log记录Gold inchlmon 检测报文,发包失败
Chassis00 slot03 2024/01/18 13:43:06:690302 [LINE:1563-TASK:dgld_main-FUNC:drv_rxtx_dpp_irftransmit]:
Unit 0 bcm_tx fail,return -2t!
查看slot 3 unit1 发包chain异常,发包失败原因是发包申请不到内存导致,设备正常使能了发包中断上报来释放内存,但是实际硬件中断没有上报导致一直没有释放内存,最终导致检测报文发送失败,产生拥塞告警。
====bcm slot 3 chip 1 soc====
dma-ch-0 TX Active Queue=5370 (c00000009f069b08) default intr mbm //发包队列拥塞
[S12504-probe]bcm s 3 c 1 g/chg/cmic_cmc0_ch0_dma_ctrl
CMIC_CMC0_CH0_DMA_CTRL.CMIC0[0x31140]=0x13: <PKTDMA_ENDIANESS=1,
DMA_EN=1,DIRECTION=1>
3.发包中断未上报原因是slot3单板CPU的pci配置空间状态寄存器bit fatal error导致,重启单板可以恢复,后续版本对该问题进行了优化
1、重启slot3可以恢复。
2、后续版本R2820H13和R2825优化了该问题,可以升级版本
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作