某台交换机运行一段时间后内存占用率高后设备死机,查看日志如下:
%Nov 22 08:30:12:523 2022 H3C DIAG/1/MEM_BELOW_THRESHOLD: Memory usage has dropped below critical threshold.
%Nov 22 08:30:25:169 2022 H3C DIAG/4/MEM_ALERT:
system memory info:
total used free shared buffers cached
Mem: 506408 453256 53152 0 0 112264
-/+ buffers/cache: 340992 165416
Swap: 0 0 0
Lowmem: 506408 453224 53184
%Nov 22 08:30:31:494 2022 H3C SHELL/6/SHELL_CMD: -Line=-IPAddr=**-User=**; Command is display loopback-detection
%Nov 22 08:30:32:283 2022 H3C DIAG/1/MEM_EXCEED_THRESHOLD: Memory critical threshold has been exceeded.
Memory statistics are measured in KB:
Total Free FreeRatio
Mem: 506408 43544 8%
LowMem: 506408 43544 --
Free-memory thresholds:
Minor: 12%
Severe: 11%
Critical: 11%
Normal: 13%
Process info(KB):
JID Used Name
235 924520 xmlcfgd
146 67020 ifmgr
997436 50304 comsh
997860 50302 comsh
997859 50266 comsh
Slub info(KB):
Used Name
9215 kmalloc-1048528
8191 kmalloc-4194256
8191 kmalloc-8388560
7167 kmalloc-524240
6398 kmalloc-262096
%Nov 22 08:30:34:160 2022 H3C DIAG/1/MEM_BELOW_THRESHOLD: Memory usage has dropped below critical threshold.
(0)
调整下内存告警阈值:
系统每隔1分钟会对内存利用率进行采样,并将采样值和用户配置的内存利用率阈值比较。当采样值大时,则认为内存利用率过高,设备会发送Trap报文。
同时系统还会实时监控系统剩余空闲内存大小,当条件达到时,就产生相应的告警/告警解除通知,以便通知关联的业务模块/进程采取相应的措施,以便最大限度的利用内存,又能保证设备的正常运行。
设备支持一级(minor)、二级(severe)和三级(critical)三个级别的门限,对应的系统剩余空闲内存越来越少,紧急程度越来越严重,关联模块根据收到的不同级别的告警可以采取不同的响应。
· 当系统剩余空闲内存第一次小于等于一级告警门限时,产生一级告警;
· 当系统剩余空闲内存第一次小于等于二级告警门限时,产生二级告警;
· 当系统剩余空闲内存第一次小于等于三级告警门限时,产生三级告警。
· 当系统剩余空闲内存大于等于二级告警门限时,产生三级告警解除通知;
· 当系统剩余空闲内存大于等于一级告警门限时,产生二级告警解除通知;
· 当系统剩余空闲内存大于等于正常内存大小时,产生一级告警解除通知。
同一级别的告警/告警解除通知是交替进行的:当系统剩余空闲内存小于等于某级告警门限,设备产生相应级别的告警,后续只有该告警解除了,系统剩余空闲内存再次小于等于某级告警门限时,才会再次生成该级别的告警。
当系统的剩余空闲内存大小如图1-3中曲线所示时,会生成如图1-3所示的告警和解除告警通知。
memory-threshold [ slot slot-number [ cpu cpu-number ] ] usage memory-threshold | 内存利用率阈值为100% | |
缺省情况下,一级告警门限为96MB,二级告警门限为64MB,三级告警门限为48MB,系统恢复到正常的内存门限为128MB | ||
memory-threshold [ chassis chassis-number slot slot-number [ cpu cpu-number ] ] usage memory-threshold | 内存利用率阈值为100% | |
缺省情况下,一级告警门限为96MB,二级告警门限为64MB,三级告警门限为48MB,系统恢复到正常的内存门限为128MB |
(0)
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
所以是告警最后导致设备死机了吗?调整告警阈值能避免死机吗?
因为我看你free的内存还有很多,也不排除软件bug,调整这个之后问题依旧可以尝试升级版本