• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

S6520-22SG-SI升级版本 7.1.070-6813P02,老是报内存预警阈值已被超过

6小时前提问
  • 0关注
  • 0收藏,29浏览
粉丝:0人 关注:0人

问题描述:

S6520-22SG-SI版本 7.1.070-6628P47升级为 7.1.070-6813P02后,内存占用率从原来的百分之73左右升到百分之83左右,内存占用率提升了百分之十左右、现在老是报内存预警阈值已被超过,如下图

还老报警告端口的队列2中发生数据包丢失

升级后的版本如下

版本信息
H3C Comware Software, Version 7.1.070, Release 6813P02
Copyright (c) 2004-2024 New H3C Technologies Co., Ltd. All rights reserved.
H3C S6520-22SG-SI uptime is 0 weeks, 1 day, 2 hours, 55 minutes
Last reboot reason : User reboot

Boot image: flash:/S6520SGSI-cmw710-boot-r6813p02.bin
Boot image version: 7.1.070, Release 6813P02
Compiled Nov 28 2024 16:00:00
System image: flash:/S6520SGSI-cmw710-system-r6813p02.bin
System image version: 7.1.070, Release 6813P02
Compiled Nov 28 2024 16:00:00
Feature image(s) list:
flash:/S6520SGSI-cmw710-freeradius-r6813p02.bin, version: 7.1.070, Release 6813P02
Compiled Nov 28 2024 16:00:00
flash:/S6520SGSI-cmw710-escan-r6813p02.bin, version: 7.1.070, Release 6813P02
Compiled Nov 28 2024 16:00:00


Slot 1:
Uptime is 0 weeks,1 day,2 hours,55 minutes
S6520-22SG-SI 1 Processor with 2 cores
BOARD TYPE: S6520-22SG-SI
DRAM: 1024M bytes
FLASH: 1024M bytes
PCB 1 Version: VER.A
Bootrom Version: 104
CPLD 1 Version: 001
Release Version: H3C S6520-22SG-SI-6813P02
Patch Version : None
Reboot Cause : UserReboot
[SubSlot 0] 14SFP Plus + 8GE

2 个回答
粉丝:21人 关注:1人

针对您升级 H3C S6520-22SG-SI 到 6813P02 版本后出现的“内存占用率升高至 83%”及“队列2丢包”两个问题,这在设备运维中属于典型的新版本资源基线变化突发流量缓存不足叠加的现象。以下是详细的分析与解决建议:

一、 内存占用率升高(73% → 83%)问题分析

S6520-22SG-SI 的物理 DRAM 仅为 1GB。在 Comware V7 架构下,随着新版本的发布,系统底层会加载更多的特性模块(如您版本信息中的 freeradiusescan 等),这会导致空跑状态下的基础内存水位自然上涨。从 73% 升至 83% 属于新版本正常的基线变化范围。
排查与处理步骤:
  1. 确认是否为内存泄漏:使用 display memory 和 dis process memory 命令持续观察。如果内存使用率稳定在 83% 左右不再持续增长,则无需干预;如果发现数值还在以每分钟/每小时的速度持续攀升,则可能存在内存泄漏,需收集诊断信息联系厂家。
  2. 清理僵尸会话释放内存:部分老版本存在 comsh 进程僵死导致内存不释放的已知缺陷。您可以执行 display process comsh all 查看是否有非当前登录的残留会话。若有,可通过 free user <会话ID> 或 reset process comsh 来安全回收内存。
  3. 终极手段:若内存居高不下且影响业务,建议在业务低峰期将设备升级到官方最新推荐的稳定版,或直接重启一次设备以彻底释放碎片化内存。

二、 端口队列2丢包问题分析

在未手动配置复杂 QoS 策略的情况下,H3C 交换机默认采用严格优先级(SP)调度,普通业务流量会被映射到默认的队列2。当发生出方向拥塞时,队列2的缓冲区极易被填满从而导致丢包。结合您刚升级版本的背景,大概率是以下原因导致:
  1. 毫秒级瞬时突发流量(Micro-burst):即使您看到的端口平均流量只有几个 G,但在多对一转发模型下,毫秒级的瞬时峰值可能瞬间打满端口,超出固定 Buffer 的缓存能力。
  2. 服务器 Bonding 哈希不均:如果您的下联设备(如服务器或录像机)使用了网卡绑定(Bond mode 0 或 mode 4),哈希算法可能导致某一条物理链路流量严重倾斜,引发单端口过载丢包。
优化与解决建议:
  1. 开启 Burst Mode(强烈推荐):这是解决此类突发丢包的首选方案。该模式取消固定区域分配,让所有端口动态共享整个 Buffer,大幅提升容错能力。
    <H3C> system-view [H3C] burst-mode enable
    配置后可通过 display buffer 对比开启前后的 Buffer 分配变化。
  2. 精细化调整队列2缓存:如果开启 Burst Mode 后仍有少量丢包,可手动扩大队列2的共享缓存比例:
    H3C> system-view [H3C] buffer egress cell queue 2 shared ratio 100 [H3C] buffer apply
  3. 检查下联设备负载均衡:排查下联服务器的 Bonding 模式,若为 mode 0 或 mode 4,尝试更改哈希策略(如改为 layer3+4)或切换为 mode 1 (active-backup) 测试是否还会丢包。

暂无评论

粉丝:15人 关注:2人

一、内存占用升高并报预警的问题
1. 告警说明
Memory early-warning threshold has been exceeded
你的设备是 S6520-22SG-SI,硬件只有 1GB DRAM,升级后内存从 73% 涨到 83%,已经触发了设备的Early-warning 10% 阈值(Free Ratio 15%,低于 20% 就会告警)。
2. 核心原因
新固件 6813P02 本身功能更全(带 FreeRADIUS、eScan 等扩展包),占用了更多常驻内存;
你的设备只有 1GB 内存,属于低配置型号,跑新版本很容易吃满内存;
日志里可以看到 comsh、xmlcfg、lauthd 等进程占用高,说明 CLI、配置管理、认证服务等进程也在消耗内存。
3. 解决方案(按优先级)
方案 1:回退到原来稳定的 6628P47 版本(最稳妥)
这是最直接的解决方式,版本占用内存低,且你之前运行稳定:
bash
运行
# 1. 上传旧版本文件到flash
tftp x.x.x.x get S6520SGSI-cmw710-system-r6628P47.bin flash:

# 2. 设置为启动文件
boot-loader file flash:S6520SGSI-cmw710-system-r6628P47.bin all

# 3. 重启生效
reboot
方案 2:关闭不必要的功能释放内存(如果不想回退)
bash
运行
# 关闭未使用的扩展功能(如eScan/FreeRADIUS,如不用)
undo feature escan
undo feature freeradius

# 关闭不必要的日志功能
undo info-center enable

# 关闭ARP/ND优化(非必要时)
undo arp fast-forwarding enable

# 保存配置并重启
save
reboot
方案 3:调整内存告警阈值(仅屏蔽告警,不解决实际占用)
bash
运行
system-view
memory early-warning threshold minor 5 severe 3 critical 1
⚠️ 注意:这只是屏蔽告警,不降低内存占用,只是避免刷屏。
二、端口队列 2 丢包 / 拥塞的问题
1. 告警说明
Packet loss occurs in queue 2 of GigabitEthernet1/0/20
output buffer drop packets exceeded the upper threshold
这是典型的端口出方向拥塞导致的队列丢包,和内存升高有直接关联:
内存不足会影响芯片的缓冲区调度,导致队列资源无法及时释放;
高内存占用会让 CPU 处理拥塞通知、流量调度的效率下降,加重丢包;
端口流量突发时,队列 2 的缓冲不够,就会触发丢包告警。
2. 解决方案
1. 先解决内存问题(优先)
内存占用降下来后,芯片缓冲区调度效率会恢复,丢包会明显减少。
2. 调整队列调度参数(缓解拥塞)
bash
运行
system-view
interface GigabitEthernet 1/0/20
qos wrr queue 1 weight 1
qos wrr queue 2 weight 3 # 调高队列2权重,优先调度
qos wfq queue 2 bandwidth 300000 # 给队列2分配更多带宽
3. 排查端口流量是否异常
bash
运行
display interface GigabitEthernet 1/0/20
display qos queue statistics interface GigabitEthernet 1/0/20
看是否有持续的大流量或突发流量,是否需要限流或分流。
三、推荐的处理顺序
优先回退到 6628P47 版本,解决内存占用过高的根本问题;
观察内存占用是否回到 73% 左右,丢包告警是否消失;
如果仍有丢包,再调整队列调度参数;
若必须使用新版本,关闭所有未使用的扩展功能

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明