• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

acket loss occurs in queue 2告警

4小时前提问
  • 0关注
  • 0收藏,36浏览
粉丝:0人 关注:0人

问题描述:

UC纳管交换机之后,UC上面会有交换机上送的一些Packet loss occurs in queue 2 of GigabitEthernet1/3/0/4的告警,但是实际业务ping测试的时候又没有丢包。这种问题应该怎么排查?一般会是什么问题导致的,有没有相关处理方法?

3 个回答
已采纳
粉丝:9人 关注:2人

一句话结论

这个告警 不是业务层面的丢包,是交换机 端口出队列(Queue 2)发生了微秒级瞬时尾丢弃 / 队列拥塞丢弃 **,只发生在芯片缓存里,ping 这种小包基本测不出来,所以业务看着正常。**

一、告警含义

plaintext
Packet loss occurs in queue 2 of GigabitEthernet1/3/0/4
  • Queue 2:默认是 AF 类队列(业务数据、普通业务流)
  • 队列丢包:端口出口排队时,瞬时流量突发 > 队列缓存 → 交换机主动丢包
  • 特点:
    • 毫秒 / 微秒级突发
    • 只丢少量大包、长包
    • ping 不丢、视频 / 语音可能偶尔卡顿、TCP 重传
    • U-Center 是抓取设备 QoS 队列丢包计数 上送的告警

二、最常见 4 个原因(按概率)

1. 端口瞬时流量突发(最常见)

  • 下联服务器 / 摄像头 / AP / 虚拟机 瞬间打满带宽
  • 队列缓存瞬间占满 → 触发尾丢弃
  • 典型:
    • 大文件拷贝、备份、镜像、日志汇总
    • 摄像头批量码流突发

2. 端口速率不匹配 / 双工半双工问题

  • 比如:1G 全双工 ↔ 100M 半双工
  • 会产生大量冲突 + 队列丢包
  • 但业务不明显

3. QoS 队列缓存配置太小(Queue 2 权重 / 缓存偏低)

H3C 交换机默认队列调度:
  • Queue 6/7(语音、关键业务)缓存大、优先级高
  • Queue 2 属于普通业务,缓存较小
    稍微一拥塞就丢

4. 接口镜像、引流、ACL 统计等导致芯片压力

  • 端口配置了 流镜像 / NetStream / 端口镜像
  • 芯片内部带宽抢占 → 队列轻微丢包
  • 只上报告警,不影响业务

三、怎么确认是不是真拥塞?(在交换机上执行)

1. 看接口队列丢包计数

plaintext
display qos queue-statistics interface GigabitEthernet1/3/0/4
看 Queue 2 的:
  • Drop packets / Drop bytes
    如果 持续缓慢增长 → 真实拥塞
    如果 只涨过一次、之后不动 → 瞬时突发,不用管

2. 看接口带宽利用率

plaintext
display interface GigabitEthernet1/3/0/4
input/output utilization
  • 持续 > 70% → 确实带宽不够
  • 平时很低 → 瞬时突发

3. 看错误报文

plaintext
display interface GigabitEthernet1/3/0/4 | include error
  • 是否有 CRC、冲突、帧校验错
    有 → 物理链路 / 光模块 / 网线问题

四、怎么解决?(3 种实用方案)

方案 1:调大 Queue 2 队列缓存(推荐,最根治)

cli
system-view # 进入队列模板(默认0号) qos queue-profile 0 # 给队列2分配更大缓存(单位: cell,默认很小) queue 2 buffer-size cell 1024 # 应用到全局 qos apply queue-profile 0 save

方案 2:关闭该队列的告警上报(不解决问题,但消告警)

cli
system-view undo alarm qos-queue-drop save

方案 3:如果是瞬时突发,可增加端口队列加权轮询权重

cli
qos queue-profile 0 queue 2 weight 10 # 默认一般是 5~8,调大 qos apply queue-profile 0

五、你这种场景的最佳判断

  • U-C 告警 → 交换机队列丢包计数触发
  • 业务 ping 正常 → 只是微小丢弃,不影响使用
  • 90% 情况属于 正常交换芯片行为,不是故障

六、最简处理建议

  1. 先执行:
    plaintext
    display qos queue-statistics interface GigabitEthernet1/3/0/4
    看丢包是否持续增长。
  2. 如果不持续
    → 直接在 U-Center 里 屏蔽该告警 或交换机上关闭告警。
  3. 如果持续增长
    → 调大 Queue2 缓存(方案 1)即可彻底解决。

暂无评论

粉丝:2人 关注:9人

排查步骤:
1. 登设备查实时队列丢包:display qos queue-statistics interface GigabitEthernet1/3/0/4 outbound,确认queue2丢包是否持续增量,若仅历史计数不增长,为历史偶发丢包遗留告警。
2. 查端口QoS配置:display qos policy interface GigabitEthernet1/3/0/4 outbound,核对队列2(默认EF队列,承载语音/实时业务)的CIR带宽、队列长度配置。
3. 验证流分类规则:display traffic classifier,确认是否非实时流量被误标记进队列2导致拥塞。
常见原因:
队列2分配的CIR带宽小于实际业务峰值流量,超过部分被尾丢弃;ICMP默认走BE队列(队列0),因此ping测试无感知,少量丢包业务也可能无感知;也可能是队列缓存设置过小,突发流量无法缓冲直接丢包。
处理方法:
1. 历史遗留告警:执行reset qos queue-statistics interface GigabitEthernet1/3/0/4清空统计,后续无新增丢包则UC侧清除告警即可。
2. 带宽不足:调大队列2的CIR(建议不超过端口带宽30%,避免抢占其他队列资源),变更前务必备份配置。
3. 突发丢包:适当调大队列2的缓存长度,关键命令:qos queue 2 length <缓存数值>。

暂无评论

粉丝:12人 关注:1人

这个告警的本质是交换机内部队列的微突发丢包,通常不代表业务层面已经出现可感知的故障。Ping测试(尤其是小包)很可能测不出这类瞬时丢包,所以会出现“只告警、业务正常”的现象。


 核心原因:看不见的“微突发”流量

告警指向的是交换机端口GigabitEthernet1/3/0/4的出方向(Egress)队列2(Queue 2)发生了丢包。端口每秒的平均流量看起来正常,但在毫秒或微秒级别内,数据流量瞬间“挤爆”了分配给该队列的缓存,导致来不及处理的数据包被丢弃。

队列2通常承载的是业务数据流(如文件传输、数据库同步),其默认分配的缓存较小,更容易发生这类突发拥塞。而Ping测试使用的ICMP报文通常走优先级更低的队列0,几乎不参与队列2的拥堵,这解释了为什么业务测试没有感知。


 排查步骤:三步定位问题根源

你可以按以下步骤,从现象确认到根源排查,层层深入:

  1. 确认告警实时性:这是避免无效排查的关键。先登录交换机,执行命令查看队列2的丢包计数是否还在持续增长

    display qos queue-statistics interface GigabitEthernet1/3/0/4 outbound 如果计数不再增长:说明这是过去某个时间点发生的历史告警,已被UC记录但未清除。可以执行 reset qos queue-statistics interface GigabitEthernet1/3/0/4 outbound 清空统计,并观察UC上的告警是否会消失。
    • 如果计数持续增长:确认存在当前活跃的队列丢包,需要继续进行以下排查。

  2. 定位“瞬时拥塞”源头:这是最核心的步骤,重点排查以下几类场景:

    • 排查服务器侧:如果对端服务器做了网卡绑定,检查其模式是否为mode 0 (平衡轮询) 或mode 4 (动态链路聚合)。不恰当的哈希算法可能导致流量不均衡,全部压到当前端口上。

    • 排查业务侧:检查是否存在定时任务(如整点数据备份、日志同步、虚拟机迁移),这些任务可能在瞬间产生巨大的流量突发。

    • 检查端口协商:确认两端端口是否都工作在全双工模式下。使用 display interface GigabitEthernet1/3/0/4 查看,不匹配的协商会导致冲突和丢包。

  3. 分析丢包的数据特征:若想精准定位是哪种流量导致了拥塞,可以配置ACL进行统计:

    # 1. 创建ACL匹配特定流量(例如,匹配源IP)
    acl number 3000 rule 10 permit ip source 192.168.1.1 0 quit # 2. 创建流分类和流行为 traffic classifier test_classifier operator and if-match acl 3000 quit traffic behavior test_behavior accounting packet quit # 3. 将策略应用到接口的出方向 qos policy test_policy classifier test_classifier behavior test_behavior quit interface GigabitEthernet1/3/0/4 qos apply policy test_policy outbound之后可通过 display qos policy interface GigabitEthernet1/3/0/4 查看该ACL匹配到的流量是否与队列2的丢包增长同步。


 处理方法:四套解决方案

找到原因后,可以根据现网情况选择最合适的方案,配置前请务必备份。

  • 方案一:启用Burst Mode(首选,推荐)
    这是处理突发流量最简单有效的方法,能动态调整缓冲区分配,更好地吸收突发流量,且对业务影响最小。

    system-view
    burst-mode enable
  • 此命令需在设备全局视图下配置
  • 方案二:优化队列调度
    如果确认队列2的瞬时流量只是略高,可以通过修改调度模式并为队列2预留一定比例的带宽,确保它在拥塞时也能得到保障。

    interface GigabitEthernet1/3/0/4
    qos wrr # 将调度模式改为加权轮询 qos wrr 2 group 2 weight 20 # 为队列2分配权重,数值越大,保障带宽越高
  • 方案三:手动扩大队列缓存
    如果Burst Mode不适用,可以直接为队列2分配更大的专用缓存空间。

    system-view
    buffer egress cell queue 2 shared ratio 100 buffer apply此命令将队列2的共享缓存比例设为100%,能显著提升其吸收突发流量的能力
  • 方案四:根除业务层面原因

    1. 优化服务器配置:调整服务器网卡绑定模式,建议使用 mode 4 (802.3ad) 并配合交换机的动态链路聚合,以实现更好的负载均衡。

    2. 分散业务流量:错开重要服务器上的定时备份、大数据同步等任务的时间点,避免产生流量尖峰。


 如果业务已受影响

如果问题已经恶化到影响业务,可以按以下步骤快速排查和缓解:

  1. 执行快照:立即收集诊断信息,供后续分析。

    display qos queue-statistics interface GigabitEthernet1/3/0/4 outbound
    display interface GigabitEthernet1/3/0/4
  2. display current-configuration interface GigabitEthernet1/3/0/4
  3. 快速止损:考虑临时重启端口 restart,或调整链路聚合组的负载分担算法 link-aggregation load-sharing mode,但这些操作有风险,建议在业务低谷或窗口期进行。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明