Peer-Link 状态检查(最可能的原因)
dis interface brief | include Peer (查看Peer-Link物理接口状态)dis interface Ten-GigabitEthernet x/x/x (您的Peer-Link接口) 查看是否有错包、CRC错误,或物理层状态为down。Keepalive 链路状态检查(第二可能的原因)
dis mlag keepalive系统参数一致性检查(基础但必须一致)
M-LAG两台设备的以下参数必须完全相同:
dis mlag 查看。两端必须配置相同的域ID。dis stp global 查看。两端必须一致(如均为RSTP或MSTP)。dis mlag 查看“System MAC”或相关配置。两端应配置为相同的MAC地址,或使用自动生成功能。dis mlag 查看。两端应为不同的编号(如1和2),这个您已经通过优先级体现了,但也要确认 mlag system-number 配置了。配置同步与保存
save 命令保存配置。未保存的配置在设备重启后丢失,会导致M-LAG无法建立。为了更精准定位,请在两台设备上分别执行以下命令,并对比输出:
# 1. 查看M-LAG全局状态(最核心)
dis mlag verbose
# 2. 查看Peer-Link详细信息
dis interface mlag-peer-link brief
# 或
dis link-aggregation verbose | include Peer
# 3. 查看Keepalive状态详情
dis mlag keepalive statistics
# 4. 查看是否有M-LAG错误或告警日志
dis logbuffer | include MLAG|M-LAG|peer
根据您的描述(优先级已配,Initial role为none),问题大概率出在以下方面:
导致 display m-lag role 输出中 Initial role 为 none 的常见原因有很多。我来帮你系统地梳理一下排查路径。
在深入排查前,先来了解一下相关的概念,这能帮我们理清思路。
Initial role (none) 表示设备在未经过任何选举计算前的初始状态。正常情况下,当 Peer-Link 和 Keepalive 链路都正常工作时,会通过严格的比较流程完成角色计算。如果 Effective role 也停留在 none 且 Reason 显示为 single none role,这意味着设备的 Peer-Link 和 Keepalive 通信可能存在根本性问题。
这是最常见的问题根源。你可以使用 display m-lag summary 命令查看整体状态-28,若显示状态异常,可以按下面的步骤排查。
查看命令:display interface 检查聚合组成员端口是否为UP,或使用 display link-aggregation verbose 检查聚合组的成员端口是否均处于 S (Selected) 状态。
排查要点:
物理连接:确保光模块或电缆连接稳固,指示灯正常。即使端口UP,也要检查 display interface 输出中是否有大量CRC错误或丢包。
VLAN配置:确保 Peer-Link 聚合接口下放行了所需的必要 VLAN,尤其是用于三层通信的 VLAN。
Keepalive 是检测“脑裂”的关键,配置时需格外细致。
查看命令:display m-lag keepalive
排查要点:
接口状态:用于 Keepalive 的接口(物理口或 VLAN 接口)必须为 UP。
IP连通性:确保源、目的IP地址正确。有些设备在M-LAG未完全建立时可能禁Ping,但三层必须可达。
UDP端口:确保用于 Keepalive 的 UDP 端口(默认 6400)未被其他应用占用或阻断。
以下是决定 M-LAG 能否成功建立的关键项,可登录设备使用 display current-configuration 核对。
系统参数:两台设备的 Domain ID 必须一致。
M-LAG System Number 与 Role Priority:
System Number:如 m-lag system-number 1,两台设备必须不同。
Role Priority:值越小越优,确保你期望的主设备优先级更高。
M-LAG System MAC:两台设备必须配置相同或确保自动生成的MAC一致。
全局配置:诸如 STP 模式等关键功能,在两台设备上必须保持一。
如以上检查均正常,可以再排查以下两种情况:
设备重启后的“None”状态:当M-LAG系统的其中一台设备重启并恢复后,默认会有一个短暂的 600秒 自动恢复计时。在这期间,该设备会处于None角色,M-LAG接口也会处于 M-LAG DOWN 状态。此时需要做的只有一件事:耐心等待计时结束。
脑裂后Split Recovery状态:如果两台设备都处于None状态,可能触发了MAD(多Active检测)。此时,被检测为分裂的备用设备会主动关闭除保留接口外的所有端口。可以执行 display m-lag mad verbose 查看MAD状态。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论