您好,对接 spine 的聚合未选中(无活跃成员)不会直接导致 m-lag keepalive 状态异常,当前故障核心原因是 “Local Tx failed”(本地发送失败),需聚焦 keepalive 链路本身的发送侧问题排查。
模块不同厂商会导致Local Tx failed告警吗?
要解决 M-LAG Keepalive 链路状态异常的问题,需从Keepalive 配置、链路物理状态、配置一致性、流量拦截规则等维度逐一排查。以下是具体整改步骤:
一、核心问题定位
Keepalive 状态 DOWN (Local Tx failed) 说明本地设备尝试发送 Keepalive 报文失败,与对接 Spine 的聚合是否选中无直接关联(Spine 聚合影响业务流量,不直接控制 Keepalive 心跳)。需聚焦以下环节:
二、分步整改操作
1. 核查 Keepalive 基础配置一致性
确保两台设备的 Keepalive 配置完全一致,包括 ** 目的 IP、源 IP、UDP 端口、VPN 实例(若有)** 等:
# 设备1查看Keepalive配置
display m-lag keepalive
# 设备2执行相同命令,对比配置是否完全一致
若发现Destination IP/Source IP/UDP port不一致,需统一配置。例如:
m-lag keepalive destination-ip 1.1.1.2 source-ip 1.1.1.1 udp-port 6400
2. 检查 Keepalive 聚合接口与物理端口状态
尽管聚合接口显示UP,仍需确认物理端口无故障、聚合配置无逻辑错误:
# 查看Keepalive聚合接口(如BAGG1024)的物理成员端口状态
display interface Bridge-Aggregation1024
display interface XGE0/0/39 # 假设为聚合成员端口,替换为实际端口
若物理端口存在Down或Error,排查线缆、光模块或端口配置(如速率、双工模式需与对端匹配)。
若聚合接口配置为Manual模式,需确保两端聚合组Loadsharing Type、Aggregation Mode完全一致。
3. 分析接口发送失败的底层原因
通过接口统计信息定位 “Local Tx failed” 的具体诱因:
display interface Bridge-Aggregation1024 | include Tx
display interface XGE0/0/39 | include Tx
若存在发送丢包(Tx Discards)或输出错误(Tx Errors),需排查:
物理链路:更换线缆、光模块,确认对端设备端口未封禁。
接口配置:确保接口未配置shutdown,且 MTU、VLAN 等配置与对端兼容。
4. 核查 M-LAG 配置一致性
M-LAG 主备角色、系统 MAC、优先级等配置不一致会导致心跳逻辑异常:
# 设备1查看M-LAG系统信息
display m-lag system
# 设备2执行相同命令,对比以下字段是否一致:
# - Local system priority / Peer system priority
# - Local bridge MAC / Peer bridge MAC
# - Local effective role / Peer effective role
若发现system priority或bridge MAC不一致,需统一配置。例如:
m-lag system priority 123
m-lag bridge-mac 9074-2e09-6400
5. 检查流量拦截规则(ACL / 策略路由)
若设备配置了 ACL 或策略路由,可能误拦截 Keepalive 的 UDP 报文(默认端口6400):
# 查看是否存在拦截UDP 6400端口的ACL
display acl all | include 6400
# 查看是否存在策略路由引导Keepalive流量到错误路径
display ip policy-based-route
若发现 ACL 拦截,需添加放行规则:
acl number 3000
rule permit udp destination-port eq 6400 # 放行Keepalive报文
6. 重启 Keepalive 链路(兜底操作)
若上述配置均无问题,可尝试重启 Keepalive 功能触发恢复:
# 设备1执行
undo m-lag keepalive
m-lag keepalive destination-ip 1.1.1.2 source-ip 1.1.1.1 udp-port 6400
# 设备2执行相同操作
三、验证恢复效果
完成配置调整后,执行以下命令验证:
display m-lag summary
display m-lag keepalive status
若 Keepalive 状态变为Up,且Peer is alive for显示正常时长,说明问题解决。
通过以上步骤,可彻底解决 “Local Tx failed” 导致的 Keepalive 异常,确保 M-LAG 双活系统的心跳检测正常运行。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
模块不同厂商会导致Local Tx failed告警吗?