• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

MSR3610 sys和丢包 告警问题

13小时前提问
  • 0关注
  • 0收藏,25浏览
粉丝:0人 关注:1人

问题描述:

请问,MSR3610 堆叠后,只有一台机器SYS灯闪烁吗?现在另一台sys不亮灯,powr 亮。目前看IMC监控两个路由器承载的移动和联通专线都有数据这是正常现象吗?dis irf 是有 master和 standby 的,dis device manuinfo slot1、2都有。

前两天发现用acl 指定移动出口的时候同时ping www.baidu.com 和***.***时  百度丢包,但是hao123不丢,有时候ping广发银行网站和好123,会同时丢包。指定联通出口时基本不丢包,有时候ping百度和广发银行又只有银行丢包百度不丢包。网关和内网始终不丢包的,请问这个问题如何检查啊?已经把互联网专线拔下来接在电脑上测了,不丢包。路由器下联透明部署的防火墙、ACG 威胁阻断感知平台。再到核心交换机,然后端口镜像了360安全趋势感知平台。路由器log中每天不停有如下的检测失败和成功的日志。

Reaction entry 1 of NQA entry admin-name to cuc operation-tag ping: probe-fail.

Reaction entry 1 of NQA entry admin-name to cuc operation-tag ping: probe-pass

1 个回答
粉丝:12人 关注:0人

从您的描述和ping测试结果可以看出:
✅ ​​内网和网关不丢包​​ - 说明局域网内部正常
✅ ​​专线直连电脑不丢包​​ - 说明运营商线路本身正常
❌ ​​通过路由器特定链路时出现间歇性丢包​​ - 问题集中在路径选择和负载策略
❌ ​​NQA检测频繁失败​​ - 链路质量检测机制有问题
解决方案
第一步:检查IRF堆叠状态
# 检查IRF堆叠状态
display irf
# 确认两台设备都是Active状态,一台Master一台Standby是正常的

# 检查设备状态
display device manuinfo
# 确认两台设备都能识别到

# 检查堆叠端口状态
display irf topology
display irf configuration
​​SYS灯问题​​:在IRF堆叠中,只有Master设备的SYS灯会规律闪烁,Standby设备SYS灯可能不亮或慢闪,这是正常现象。只要display irf显示状态正常即可。
第二步:优化NQA检测配置
您日志中的NQA失败是问题的关键。当前配置可能过于敏感:
# 查看当前NQA配置
display nqa history admin-name to cuc operation-tag ping
display nqa statistics admin-name to cuc operation-tag ping

# 优化NQA配置示例
nqa entry admin mobile-line # 移动线路检测
type icmp-echo
destination-ip 223.5.5.5 # 使用可靠DNS
frequency 5000 # 检测间隔改为5秒
timeout 4000 # 超时4秒
probe count 3 # 每次探测3个包
reaction 1 checked-element probe-fail threshold-type consecutive 5 # 连续5次失败才判定

nqa entry admin unicom-line # 联通线路检测
type icmp-echo
destination-ip 114.114.114.114
frequency 5000
timeout 4000
probe count 3
reaction 1 checked-element probe-fail threshold-type consecutive 5
第三步:检查并优化负载均衡策略
当前ACL策略可能导致路径选择不合理:
# 查看当前ACL和路由策略
display acl all
display route-policy
display ip routing-table

# 优化策略配置示例
acl advanced 3100
rule 5 permit ip destination 113.108.153.0 0.0.0.255 # 广发银行IP段走联通
rule 10 permit ip destination 163.177.177.0 0.0.0.255 # 百度相关走移动

# 创建基于应用类型的策略路由
traffic classifier critical-app operator and
if-match acl 3100

traffic behavior mobile-path
redirect next-hop [移动网关]

traffic behavior unicom-path
redirect next-hop [联通网关]

# 应用策略
qos policy app-route
classifier critical-app behavior mobile-path
classifier default-class behavior unicom-path
第四步:会话保持和链路切换优化
# 启用会话保持,避免链路切换时连接中断
session persistent enable
nat session persistent enable

# 调整链路切换参数,避免频繁切换
interface Dialer1 # 移动线路
link-protocol ppp
ppp timer handshake 30
timer hold 10 interval 5

interface Dialer2 # 联通线路
link-protocol ppp
ppp timer handshake 30
timer hold 10 interval 5
第五步:实时监控和诊断
# 实时查看链路状态
display interface Dialer1
display interface Dialer2

# 查看NQA实时状态
display nqa result admin mobile-line
display nqa result admin unicom-line

# 查看会话表,确认流量路径
display session table source-ip [内网IP] verbose

# 开启调试(临时)
debugging ip packet acl 3100 # 只监控关键流量
terminal debugging
terminal monitor
针对性解决方案
针对"百度丢包但hao123不丢包"
这是因为不同域名解析到不同CDN节点,路径可能不同:
# 为百度特定IP段优化路由
acl advanced 3200
rule 5 permit ip destination 110.242.0.0 0.0.255.255 # 百度主要IP段
rule 10 permit ip destination 220.181.0.0 0.0.255.255 # 百度其他IP段

# 强制百度流量走更稳定链路
route-policy baidu-route permit node 10
if-match acl 3200
apply ip-address next-hop [联通网关]
针对广发银行丢包问题
# 广发银行IP段固定走联通
acl advanced 3300
rule 5 permit ip destination 113.108.153.0 0.0.0.255
rule 10 permit ip destination 113.108.154.0 0.0.0.255

route-policy cgb-route permit node 10
if-match acl 3300
apply ip-address next-hop [联通网关]
预防性维护建议
​​定期检查链路质量​​:
# 设置定时任务检查链路
job check-link
view log | inc "NQA|Dialer"
​​配置自动告警​​:
# 链路故障邮件告警
snmp-agent trap enable
snmp-agent target-host trap address udp-domain 监控服务器IP params securityname public
​​业务时段优化​​:
业务高峰期:减少NQA检测频率,避免对业务影响
深夜维护期:可以进行更频繁的检测和优化
紧急处理措施
如果问题严重影响业务,可以临时采用:
# 临时将全部流量切到联通线路
ip route-static 0.0.0.0 0 Dialer2 preference 5

# 或者按权重分配,但偏向稳定链路
ip route-static 0.0.0.0 0 Dialer1 preference 10
ip route-static 0.0.0.0 0 Dialer2 preference 5
总结
您的问题主要是由于​​负载均衡策略不够智能 + NQA检测过于敏感​​导致的。通过优化检测参数、细化路由策略、启用会话保持,可以显著改善丢包问题。
建议按以下顺序操作:
先优化NQA检测参数
然后配置基于应用的策略路由
最后启用会话保持机制
需要我帮您查看具体的当前配置吗?可以提供display current-configuration的相关输出。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明