• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

交换机 内存使用率告警

5天前提问
  • 0关注
  • 0收藏,66浏览
粉丝:0人 关注:0人

问题描述:

每小时都会告警,是什么原因?

已超过内存预警阈值。内存统计数据以KB为单位进行测量:总可用FreeRatio Mem:999608 142684 14%LowMem:999608142684--可用内存阈值:轻微:10%严重:7%严重:5%正常:13%预警:10%安全:20%进程信息(KB):JID使用名称267 52908 comsh 335 33004 xmlcfgd 269 13408 lauthd 204 12336 dbmd 516 5868路由Slub信息(MB):使用名称106495 kmalloc-8388560 35280 kmalloc-2048 24822 kmalloc-131024 18431 kmalloc-2097104 16383 kmalloc-4194256

最佳答案

粉丝:10人 关注:2人

交换机内存每小时告警、占用 14% 原因 + 根治办法

先帮你把告警数据翻译 + 定位根因:

一、先看你的告警数据

  • 总内存:999608 KB
  • 空闲内存:142684 KB
  • 内存使用率:约 14.27%
  • 阈值:预警 10%、严重 7%、危急 5%
  • 现在卡在 14% 刚过预警线,每小时触发告警

二、占用内存最大进程(元凶一目了然)

  1. comsh 52908 KB 命令行 shell、后台任务进程(占最高)
  2. xmlcfgd 33004 KB 配置下发、网管 / IMC 纳管、XML 配置解析进程
  3. lauthd /dbmd 认证、数据库后台进程
核心结论
不是业务流量占内存,是 xmlcfgd + comsh 常驻占用偏高,加上设备本身基线内存开销,刚好顶到 14% 触发每小时告警。

三、为什么每小时准时告警?

  1. 设备每小时定时采集内存快照,刚好基线占用就 13%~15% 波动
  2. iMC / 云简 / 网管系统 定时拉配置、拓扑、状态,xmlcfgd 持续涨内存
  3. 配置里有多余 MSTP、RRPP、ERPS、ACL、策略、日志、SNMP 定时采集 累积开销
  4. 设备固件版本有内存泄漏小 bug,缓慢抬升内存占用

四、快速排查命令(现场直接敲)

cli
display memory display process memory display logbuffer | include memory display snmp-agent statistics

五、4 个落地解决办法(按优先级做)

方法 1:调内存告警阈值(最快消告警,不影响业务)

把预警阈值从 10% 调低,避开 14% 基线:
cli
# 改成预警5%、严重3%(根据设备版本适配) memory threshold warning 5 memory threshold severe 3
改完立刻不再每小时弹窗告警。

方法 2:限制网管 / IMC 定时采集,降低 xmlcfgd 负载

  1. 降低 SNMP 采集间隔,不要 1 分钟一次,改成 10 分钟以上
  2. 关闭不必要的:SNMP v1、团体字漫游、频繁拓扑探测
  3. 没用到的网管功能:关闭 web 网管、关闭多余日志上送

方法 3:清理无用配置,释放基线内存

  • 删除未使用 VLAN、ACL、流控、策略模板
  • 关闭不用生成树、环网协议、冗余协议
  • 关闭本地海量日志缓存:
cli
undo info-center enable

方法 4:升级设备固件(根治内存缓慢泄漏)

同型号老版本普遍存在 xmlcfgd/comsh 小幅内存泄漏
升级到官方最新稳定版本后,基线内存能降到 8%~10%,彻底不触发告警。

六、总结

  1. 你不是异常高占用,是设备基线 + 网管采集刚好卡在 14% 超预警线;
  2. 大内存进程是 comsh、xmlcfgd,业务没压力;
  3. 临时:调低内存告警阈值 立刻消告警;
  4. 长久:优化 SNMP 采集 + 清理无用配置 + 升级固件 降基线占用。

暂无评论

2 个回答
粉丝:7人 关注:9人

排查步骤及命令
1. 确认内存使用趋势:
执行display memory-usage history,查看内存使用率是否周期性波动,判断是临时峰值还是持续泄漏。
2. 追踪进程内存变化:
间隔1小时执行display process memory verbose,对比comsh、xmlcfgd等进程的内存占用,排查是否有进程持续增长(疑似内存泄漏)。
3. 分析内核Slub内存:
执行display memory slub,结合业务场景(如是否有大量ARP/路由条目、异常流量),确认kmalloc系列大内存分配是否为正常业务触发。
4. 排查周期性任务:
执行display schedule job,查看是否存在每小时执行的定时任务(如备份、统计)导致临时内存占用。
5. 检查系统异常日志:
执行display logbuffer,排查是否有内存分配失败、进程异常重启等日志。
注意事项
若需临时调整预警阈值,先执行save备份配置,再进入系统视图执行memory-usage threshold minor 10 severe 7 critical 5(按需修改),但优先排查根因,避免掩盖问题。若确认内存泄漏,需收集诊断信息反馈研发或升级系统版本。

暂无评论

粉丝:14人 关注:1人

交换机“每小时都会告警”大概率是设备的周期性告警重发机制引起的,不一定是内存本身每小时都出了问题。


第一步:确认告警类型与重发机制

先判断是真正的内存使用波动,还是稳定的周期性告警。

  • 操作:执行 display memory-usage history 查看内存使用率的历史曲线。如果图形在阈值线(如10%)附近稳定,且没有周期性峰谷,那么告警就极大概率是重发机制引起的。


 第二步:精准定位内存“大胃王”

即使告警是重发的,内存使用率偏高仍是事实。从你的日志来看,交换机总内存约为1GB (总:999608 KB),目前可用仅约14% (142684 KB),几个关键进程值得特别关注:

  • comsh (Comware Shell):这是用户管理访问的进程。它的高占用可能源于你登录设备后的操作命令或接收到的信息被缓存。

  • xmlcfgd (XML Configuration Daemon):这是配置管理进程。高占用可能源于过大或复杂的配置文件。

  • kmalloc: 日志显示大块kmalloc-8388560占用了约106GB的虚拟内存,这是不正常的。kmalloc是内核分配内存的关键机制,异常的kmalloc行为强烈指向了网络环路、MAC地址漂移等引发的内存分配风暴


 第三步:系统排查与必做检查

请依次执行以下检查,定位可能的问题点:

  • [必做] 检查物理环路与MAC地址漂移:STP环路会导致广播报文在交换机之间无限循环。请执行:

    • display stp brief:检查所有接口的STP状态。正常应该为FORWARDINGDISCARDING,如果有大量接口LEARNING等不稳定状态,则需排查环路。

    • display mac-address mac-move:检查MAC地址漂移记录。大量的记录值基本可以确认存在环路。

  • [必做] 检查定时任务:每小时告警也可能是某个定时任务触发的内存消耗。

    • display schedule job:查看和确认所有配置的定时任务及其执行周期。

  • [重要] 跟踪进程内存变化:为了排除内存泄漏,需要动态观察内存大户的变化趋势。

    • 现在执行 display process memory verbose,记录关键进程的内存占用。

    • 1-2小时后,再次执行此命令。如果comshxmlcfgd的占用持续增长,就存在内存泄漏嫌疑。

  • [重要] 检查系统日志:此步骤能最直接地告诉你,系统认为发生了什么问题,是定位环路和内存分配失败等问题的捷径。

    • display logbuffer:查看日志缓冲区内容,重点关注STPMAC movememory are you ok等关键词。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明