问题的核心在于:H3C交换机资源监控的“预分配”机制与业务实际状态无关,而凌晨的告警更印证了这是一种与业务无关的系统行为。
你在日志里看到的 input_flowrate_14 这条告警,它不是你理解的那种“这个接口上流量超标了”的业务告警,它其实是一个系统层面的“资源容量”告警。
告警含义:Resource=input_flowrate_14 中的数字 14 不是接口编号,而是内部资源索引(OID),input_flowrate 表示的是接口入方向的速率。日志中的 Total=10000 表示该接口所在芯片(或端口组)支持的总带宽资源,Used=34 表示当前该芯片/端口组的总入方向占用带宽,Free=9966 表示剩余空闲带宽,Free resource increased above minor threshold 20% 则是当空闲带宽恢复到20%以上时产生的“恢复告警”。
凌晨告警的关键线索:你提到告警出现在凌晨,这恰恰印证了它是一个系统级的资源告警,而非业务流量触发。凌晨通常是业务低峰期,发生流量告警是反直觉的。但正因为它监控的是芯片/端口组的总带宽占用,当夜间执行备份、数据同步等后台任务时,可能产生瞬间的高流量,导致带宽占用率变化,从而触发恢复告警。
所以,它和端口是否 shutdown、是否有用户流量没有直接关系。
要理解这个“反常”现象,需要明白 H3C Comware 系统资源监控的核心设计:
“预留”而非“实测”机制:这里的 Used=34 并非实时测得的流量,而是系统为该接口在芯片中预留的带宽资源。即便接口 shutdown,只要接口创建了,系统就会为其分配必要的硬件资源,并计入 Used 值。
资源池共享:input_flowrate_14 这样的资源对象通常对应一个物理芯片或一个端口组,一组端口共享一个资源池。日志显示的是整个端口组的资源占用情况,而不是单个接口。即使某个接口手动关闭,只要同组的其他接口有流量,Used 值就会相应变化。
告警“恢复”而非“触发”:你看到的日志 Free resource increased above minor threshold 20% 是一条恢复告警,意味着之前系统可能处于资源紧张状态,现在空闲资源回升,系统发出恢复正常通知。因此你看到的并不是“shutdown 的端口在跑流量”,而是系统级资源状态在凌晨发生了积极变化,触发恢复告警。
很可能与夜间定时任务(如备份、日志清理)有关。这些任务瞬间占用大量 I/O 资源,导致系统整体资源紧张,任务完成后又快速释放,从而触发恢复告警。
定位端口组和接口:
关联资源ID与接口:资源名 input_flowrate_14 中的 14 是内部索引,需要通过命令 display resource-monitor resource input_flowrate 查看具体关联。
确认端口组成员:通过 display interface brief 和端口组规划确定哪些物理接口共享资源池。
记录凌晨流量:在凌晨告警时段前,执行 display interface 和 display counters rate inbound 记录各接口流量。
临时关闭告警(不推荐长期关闭):
input_flowrate_14:14 号入口流量统计资源块(芯片级)Resource=input_flowrate_14 - Total=10000 - Used=34 - Free=9966
Free resource increased above minor threshold 20%
input_flowrate_14 资源# 1. 查看流量统计资源(最准)
display qos-acl resource
# 看:Inbound Flow Monitor、Outbound Flow Monitor、NetStream 项
# 2. 查看IFMON/流表占用
display flow-monitor resource
display ip netstream resource
# 3. 看哪些接口开了统计
display current | include "flow-monitor|netstream|sflow|rmon"
system-view
# 假设是 GigabitEthernet1/0/14(替换你的接口)
interface GigabitEthernet1/0/14
undo flow-monitor inbound
undo flow-monitor outbound
undo netstream inbound
undo netstream outbound
undo sflow enable
undo rmon alarm 1
undo rmon event 1
quit
save
system-view
# 清理老化流表
reset flow-monitor cache
reset ip netstream cache
# 关闭全局不必要统计
undo flow-monitor enable
undo ip netstream
undo sflow global
quit
save
system-view
# 提高资源不足阈值(默认80%→95%)
resource-threshold input-flowrate 95
# 关闭恢复告警(可选)
undo snmp-agent trap enable resource-threshold
quit
save
system-view
# 关闭凌晨自动统计(可选)
undo rmon statistics 1
# 禁用IFMON快速变化日志
info-center logging suppress module IFMON
quit
save
display flow-monitor resource
display qos-acl resource
# 看 Inbound Flow Monitor 空闲大幅上升
input_flowrate_14 是芯片流表资源,非接口流量undo flow-monitor/netstream
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
好的靓仔老师。