检查要求:
要求ASIC计数正常。从bcm命令行执行结果提取对应芯片类型的寄存器列表。若show/c、show/c/full、show/c-arad、show/c/fabric回显中存在counter collection is not running回显 或 diag/counter/p/nz first call、diag/counter/p/nz second call、diag/counter/packet/nz、show/drops/all、show/drops/all first call、show/drops/all second call、debug tm discard show回显中存在Failed to read counter则视为异常;若存在show/c回显,判断xgs计数器列表数值是否正常:若包含RFCS,RALN,RFLR,RERPKT,RFCR,RJBR,RMTUE,RPRM,RFRG,RTRFU,RRPKT,IUNKOPC,IUNHGI,RPORTD,RDISC,RIPHE6,RIPD6,RIPHE4,RIPD4,TJBR,TFCS,TDFR,TEDF,TSCL,TMCL,TLCL,TXCL,TFRG,TERR,TUFL,TNCL,TPCE,IEGRBLK,DROP_PKT,DROP_CBP_64,PERQ_DROP,MMU_RXD_PKT,MMU_RXD_NODST_PKT,E2E_DROP_COUNT,RDBGC,TDBGC,RCDE,DROP_PKT,PERQ_DROP,WRED_PKT_GRE,HOLD,FEC(若为RX FEC uncorrectable,rate不为0且plusValue/rate小于等于1000时除外),CRC(若为RX CRC errors,rate不为0且plusValue/rate小于等于100时除外)、TPCE记录存在则视为异常,存在PERQ_DROP、HOLD、DROP_PKT、WRED_PKT_GRE且rate不等于0是视为异常;若存在show/c-arad、show/c/fabric回显,判断arad寄存器数值列表是否正常:portType为fabric时snmpBcmRxCrcErrors数大于等于100,portType为nif时snmpIfInErrors或snmpIfOutErrors大于等于100则视为异常;若存在diag/counter/p/nz first call、diag/counter/p/nz second call、diag/counter/packet/nz、debug tm discard show回显,判断arad寄存器数值列表是否正常:若存在CrcErrCnt、TotDscrdPktCnt、CrcDroppedPckCnt、RqpDiscardPacketCounter、PqpDiscardUnicastPacketCounter、BurstsErr、RqpDiscard、DiscardPckCnt、IqmQueueEnqDiscardedPacketCounter、EGQ_PKT_REAS_INT_REG、IQM_GLOBAL_REJECT_STATE、IqmQueueDeletedPacketCounter、IQM_REJECT_STATUS_BMP(且存在VOQ_MX_QSZ_BUFF_STATUS或PKT_Q_MAX_BUFF_SIZE_RJCT或IDR_DRAM_REJECT_STATUS)、EGQ_PACKET_REASSEMBLY_INTERRUPT_REGISTER(且存在CRC_ERR)记录则视为异常;若存在show/drops/all、show/drops/all first call、show/drops/all second call回显,判断arad packet_flow寄存器数值列表是否正常:检查要求同diag/counter/p/nz first call,此外若存在CrcErrCnt或CrcDroppedPckCnt且值大于等于100 或 存在IqmQueueDeletedPacketCounter且值大于1000 或 存在Crc且值大于等于1000 或 存在IQM_GLOBAL_REJECT_STATE且值为GLB_RJCT_BUFF_DYN_SPACE、GLBL_RJCT_DRAM_BUFF_DYN_SPACE 或 存在EGQ_PKT_REAS_INT_REG且值为VSC_256_UC_SOP_INTR_MOP_ERR、VSC_256_UC_PKT_CRC_ERR、VSC_256_UC_MISSING_SOP_ERR、VSC_256_UC_FRAG_NUM_ERR、VSC_256_UC_CELL_SIZE_ERR 或存在IQM_REJECT_STATUS_BMP且存在VOQ_MX_QSZ_BUFF_STATUS、PKT_Q_MAX_BUFF_SIZE_RJCT、IDR_DRAM_REJECT_STATUS 或 存在EGQ_PACKET_REASSEMBLY_INTERRUPT_REGISTER且存在CRC_ERR则告警。
改进建议:
请关注计数是否增加,业务是否异常,如发现业务异常,请尽快寻求技术支持。
1.若ASIC芯片存在丢包, 实际环境中存在少量丢包属于正常现象. 该结果仅供参考. 需要结合实际问题分析. 注:请关注显示结果中的提示信息.
2.若ASIC芯片上CPU报文队列存在丢包, 超过限速/队列满. 实际环境中存在少量丢包属于正常现象. 连续查看命令行无该计数表明正常。该结果仅供参考. 需要结合实际问题分析.
3.如果存在下列寄存器计数,请尽快寻求技术支援:
IPT CRCDrop 当数量比较大(大于8,且无法清除)表示dram通道出现问题。
FDT CRCDrop 表示dram上有错误,表示芯片出现较严重硬件故障。
EGQ RQPdiscd 表示从网板接收的数据有问题,内部互联端口存在互连问题。
NBI bursterr 一般是收到的报文有错误或是报文的总量超过了arad的芯片速率。运行show/c 查看是否有error计数,数值比较大且clear/c后仍然在增长,表示连线有问题。
IQM0 TotDscrdPktCnt 表明burst流量超过端口带宽,需要核实网络流量以及端口速率是否匹配。
sfi snmpBcmRxCrcErrors 数字较大表示内部互联端口存在互连问题。
EPNI EpeDiscardedPacketsCounter计数是否正常跟环境有关系。VLAN里加入了多个端口,且有的端口没有UP,且有广播流量,这个计数正常。
IqmQueueEnqDiscardedPacketCounter计数是入队失败,一般是查表失败、ACL过滤等原因。
涉及命令:
bcm +[\w ]+ \S+
debug tm discard show [\w ]+
资源大类 |
告警级别 |
告警内容 |
网络资源-交换-S5130-28F-EI |
提示 |
共检查67信息块,3个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
网络资源-交换-S5560-34C-EI |
提示 |
共检查70信息块,6个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
网络资源-交换-S6520-52QF-EI |
提示 |
共检查70信息块,6个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
网络资源-交换-S6550XE-56HF-HI |
提示 |
共检查70信息块,6个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
网络资源-交换-S6550XE-56HF-HI |
提示 |
共检查70信息块,6个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
网络资源-交换-S6550XE-56HF-HI |
提示 |
共检查70信息块,6个存在异常(show/c结果异常.无show/c/full信息.无show/c/fabric信息.无diag/counter/packet/nz信息.无diag/counter/p/nz first call信息.无diag/counter/p/nz second call信息.无debug tm discard show信息.无show/drops/all信息.无show/drops/all first call信息.无show/drops/all second call信息.无pw信息.).检查0个pw信息块, 0个异常. |
(0)
有可能是之前的数据。在观察看看吧,根据巡检建立来就行:
请关注计数是否增加,业务是否异常,如发现业务异常,请尽快寻求技术支持。
下面的提示可以忽略,是巡检包里没有相关数据,可能是设备不支持。
(0)
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论