M-lag系统无法建立
m-lag是一种跨设备链路聚合技术,将两台物理设备在聚合层面虚拟成一台设备来实现跨设备链路聚合,从而提供设备级冗余保护和流量负载分担。当遇到m-lag系统无法建立时,具体排查步骤如下:
步骤1:检查m-lag系统状态和角色信息;
步骤2:确认配置是否完整正确;
步骤3:确认m-lag全局配置一致性检查信息和接口选中信息;
步骤4:查看对端设备的接口信息;
步骤5:查看物理接口状态信息;
步骤6:检查m-lag系统keepalive报文信息;
步骤7:收集m-lag设备之间交互信息,拨打400-810-0504热线寻求帮助
执行“display m-lag system”命令查看设备上分布式聚合系统信息,该命令显示了IPP接口的状态信息,Local和Peer字段分别显示了本端和对端的系统编号、系统mac地址、系统优先级。执行“display m-lag role”命令,该命令用来查看分布式聚合设备角色信息,包括角色优先级、设备桥mac地址、配置的设备角色和生效的设备角色。正常情况下两条命令回显如下所示。
<Sysname> display m-lag system
System information
Local system number: 1 Peer system number: 2
Local system MAC: 0001-0001-0001 Peer system MAC: 0001-0001-0001
Local system priority: 123 Peer system priority: 123
Local bridge MAC: 3cd4-3ce1-0200 Peer bridge MAC: 3cd4-437d-0300
Local effective role: Primary Peer effective role: Secondary
Health level: 0
Standalone mode on split: Enabled
In standalone mode: Yes
<Sysname> display m-lag role
Effective role information
Factors Local Peer
Effective role Primary Secondary
Status of M-LAG uplink interfacesUP DOWN
Initial role None None
MAD DOWN state Yes Yes
Health level 0 0
Role priority 32768 32768
Bridge MAC 3cd4-3ce1-0200 3cd4-437d-0300
Effective role trigger: Peer link calculation
Effective role reason: Bridge MAC
Configured role information
Factors Local Peer
Configured role Primary Secondary
Role priority 32768 32768
Bridge MAC 3cd4-3ce1-0200 3cd4-437d-0300
当前面的信息回显不正确时,需要确认m-lag的配置是否确认,查看两端设备配置的系统编号、系统mac和系统优先级。在同一个分布式聚合系统中,所有的分布式聚合设备必须配置不同的系统编号。
为了能够让对端设备将分布式聚合组中的两台设备看成一台设备,需要同一分布式聚合组中所有DR设备的系统MAC地址配置相同。当分布式系统两边设备的系统mac配置有一边没有配置时,在没配置的一边IPP接口状态显示为down,对端的系统编号、系统mac地址、系统优先级都显示为N/A,并且本端的系统mac地址也会显示为N/A。
[DeviceA] m-lag system-mac 1-1-1
[DeviceA] m-lag system-number 1
[DeviceA] m-lag system-priority 123
[DeviceB] m-lag system-mac 1-1-1
[DeviceB] m-lag system-number 2
[DeviceB] m-lag system-priority 123
在分布式聚合组正常工作的情况下,为了能够让对端设备将分布式聚合组中的两台设备看成一台设备,在与对端设备交互聚合组信息时,LACPDU中系统LACP优先级为配置的分布式聚合系统优先级,因此两端配置必须一致。当两端系统优先级不一致时,IPP接口状态为down,对端的系统编号、系统mac地址、系统优先级都显示为N/A。
在设备上执行“interface bridge-aggregation IPP口所对应的二层聚合口编号”命令,进入二层聚合口查看配置,port m-lag intra-portal-port port-id这条命令是将二层聚合接口配置为IPP口,port-id表示IPP端口索引,只能取值为1,因为每台DR设备上只能配置一个IPP口。
[DeviceA]interface bridge-aggregation 3
[DeviceA-Bridge-Aggregation3]display this
#
interface Bridge-Aggregation3
link-aggregation mode dynamic
port m-lag intra-portal-port 1
#
在设备上执行“interface bridge-aggregation DR口所对应的二层聚合口编号”命令,进入二层聚合口查看配置,port m-lag group group-id这条命令用来配置聚合接口加入分布式聚合组,group-id取值范围为1~1024。如果当前二层聚合接口已经配置为IPP口,则不允许再将其配置为DR口。一个二层聚合接口只能加入一个分布式聚合组。
[DeviceA]interface bridge-aggregation 4
[DeviceA-Bridge-Aggregation4]display this
#
interface Bridge-Aggregation4
link-aggregation mode dynamic
port m-lag group 4
#
return
在设备上执行“display m-lag summary”命令,该命令用来显示m-lag的接口摘要信息,包含IPP接口和DR接口的摘要信息,以及Type 1类型接口配置一致性检查结果,正确情况如下所示。
<DeviceA> display m-lag summary
<Sysname> display m-lag summary
Flags: A -- Aggregate interface down, B -- No peer M-LAG interface configured
C -- Configuration consistency check failed
D –- Standby status in active/standby mode
Peer-link interface: BAGG3
Peer-link interface state (cause): UP
Keepalive link state (cause): UP
M-LAG interface information
M-LAG IF M-LAG group Local state (cause) Peer state Remaining down time(s)
BAGG4 4 UP UP
在设备上执行“display m-lag verbose”命令,该命令用来显示分布式聚合系统的接口详细信息,其中Flag为DRCP协议的状态标志,长度为1字节,该字节自低位至高位分别以字母A~H表示,取值为1的标志位显示为对应的字母,取值为0的标志为不显示。A为本端设备DRCP是否开启标志,1表示开启;0表示关闭。B为邻居设备DRCP是否开启标志,1表示开启;0表示关闭。C为其他邻居设备DRCP是否开启标志,1表示开启;0表示关闭。D为本端设备IPP端口认为邻居设备DRCP是否处于开启状态,1表示是;0表示否。E为DRCP长/短超时标志,1表示短超时;0表示长超时。F为本端设备认为IPP端口是否可以通过指定网关会话ID的报文,1表示是;0表示否。G为本端设备认为IPP端口是否可以通过指定端口会话ID的报文,1表示是;0表示否。H为本端设备的接收状态机是否处于默认状态或超时状态,1表示是;0表示否。正常情况如下所示。
# 显示二层聚合接口1所对应M-LAG接口的详细信息。
<Sysname> display m-lag verbose interface bridge-aggregation 1
Flags: A -- Home_Gateway, B -- Neighbor_Gateway, C -- Other_Gateway,
D -- PeerLink_Activity, E -- DRCP_Timeout, F -- Gateway_Sync,
G -- Port_Sync, H -- Expired
M-LAG interface/M-LAG group ID: BAGG1/1
Local M-LAG interface state: UP
Peer M-LAG interface state: UP
M-LAG group state: UP
Local M-LAG role election type: ARP
Peer M-LAG role election type: ARP
Local M-LAG interface role: Standby
Peer M-LAG interface role: Standby
Local M-LAG interface down cause: -
Remaining M-LAG DOWN time: -
Local M-LAG interface LACP MAC: COnfig=0001-0001-0001, Effective=0001-0001-0001
Peer M-LAG interface LACP MAC: COnfig=0001-0001-0001, Effective=0001-0001-0001
Local M-LAG interface LACP priority: COnfig=200, Effective=200
Peer M-LAG interface LACP priority: COnfig=200, Effective=200
Local DRCP flags/Peer DRCP flags: ABDFG/ABDFG
Local Selected ports (index): GE1/0/1 (1), GE1/0/2 (2)
Peer Selected ports indexes: 260, 261
# 显示二层聚合接口2所对应的peer-link接口的详细信息。
<Sysname> display m-lag verbose interface bridge-aggregation 2
Flags: A -- Home_Gateway, B -- Neighbor_Gateway, C -- Other_Gateway,
D -- PeerLink_Activity, E -- DRCP_Timeout, F -- Gateway_Sync,
G -- Port_Sync, H -- Expired
Peer-link interface/Peer-link interface ID: BAGG2/1
State: UP
Cause: -
Local DRCP flags/Peer DRCP flags: ABDFG/ABDFG
Local Selected ports (index): GE1/0/1 (1), GE1/0/2 (2)
Peer Selected ports indexes: 258, 259
Reserved VLANs: 1, 3-10
4、查看对端设备的接口信息
在设备上执行“display link-aggregation verbose”命令,该命令用来查看连接对端设备的聚合接口所对应聚合组的详细信息,Flags为LACP协议的状态标志,长度为1字节,该字节自低位至高位分别以字母A~H表示,取值为1的标志位显示为对应的字母,取值为0的标志为不显示。A为LACP是否开启标志,1表示开启;0表示关闭。B为LACP长/短超时标志,1表示短超时;0表示长超时。C为发送端认为本成员端口所在链路是否可聚合,1表示是;0表示否。D为发送端认为本成员端口所在链路是否处于同步状态,1表示是;0表示否。E为发送端认为本成员端口所在链路是否处于收集状态,1表示是;0表示否。F为发送端认为本成员端口所在链路是否处于分发状态,1表示是;0表示否。 G为发送端的接收状态机是否处于默认状态,1表示是;0表示否。H为发送端的接收状态机是否处于超时状态,1表示是;0表示否。正常情况如下所示。
Sysname> display link-aggregation verbose bridge-aggregation 10
Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing
Port Status: S -- Selected, U -- Unselected, I -- Individual
Port: A -- Auto port, M -- Management port, R -- Reference port
Flags: A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,
D -- Synchronization, E -- Collecting, F -- Distributing,
G -- Defaulted, H -- Expired
Aggregate Interface: Bridge-Aggregation10
Creation Mode: Manual
Aggregation Mode: Dynamic
Loadsharing Type: Shar
Management VLANs: None
System ID: 0x8000, 000f-e267-6c6a
Local:
Port Status Priority Index Oper-Key Flag
XGE1/0/1 S 32768 61 2 {ACDEF}
XGE1/0/2 S 32768 62 2 {ACDEF}
Remote:
Actor Priority Index Oper-Key SystemID Flag
XGE1/0/1(R) 32768 111 2 0x8000, 000f-e267-57ad {ACDEF}
XGE1/0/2 32768 112 2 0x8000, 000f-e267-57ad {ACDEF}
5、查看物理接口状态信息
在设备上执行“display interface xxx”命令,xxx表示加入IPP接口和DR接口的物理接口编号,该命令可以用来查询分布式聚合系统相关物理接口的状态信息,包含物理状态信息和协议状态信息,可以尝试相邻设备互ping,观察接口是否有错包,以此确认二层链路是否正常。需要指出的是,当系统编号或系统mac地址两端不一致时,DR接口组中的物理接口会显示为物理up、协议down状态,且协议down的原因为Link-Aggregation interface down。
[DeviceA]display interface Ten-GigabitEthernet 2/0/16///该接口为DR接口组中的物理接口
Ten-GigabitEthernet2/0/16
Current state: DOWN ( Link-Aggregation interface down )
Line protocol state: DOWN(LAGG)
6、检查m-lag系统keepalive报文信息
在设备上执行“display m-lag keepalive”命令,该命令用来查看分布式聚合Keepalive链路的信息。缺省情况下,Keepalive报文发送的时间间隔为1000毫秒,超时时间间隔为5秒。本端DR设备的Keepalive报文超时时间必须配置成对端DR设备的Keepalive报文发送时间间隔的2倍以上。当本端发送间隔超过对端超时时间,keepalive链路状态会在up和down之间频繁切换。
<DeviceA> display m-lag keepalive
Neighbor keepalive link status: Up
Neighbor is alive for: 135642 s 501 ms
Last keepalive packet sending status: Successful
Last keepalive packet sending time: 2017/03/18 18:23:53 986 ms
Last keepalive packet receiving status: Successful
Last keepalive packet receiving time: 2017/03/18 18:23:54 99 ms
Distributed relay keepalive parameters:
Destination IP address: 10.0.0.2
Source IP address: 10.0.0.1
Keepalive UDP port : 6400
Keepalive VPN name : vpn1
Keepalive interval : 1000 ms
Keepalive timeout : 5 sec
Keepalive hold time: 3 sec
7、收集m-lag设备之间交互信息
在设备上执行“debug m-lag all”命令,该命令用来打开m-lag模块的调试开关,可以看到两端交互的DRCPDU报文和keepalive报文。在设备上执行“debug link-aggregation lacp packet all”命令,该命令用来打开LACP模块的调试开关。做了以上操作,还不能解决问题,请收集上述debug信息、相关设备的诊断信息、日志信息、诊断日志、详细组网,然后拨打400-810-0504热线寻求帮助。
常见故障现象
两台交换机做mlag,1为主,2为备。53、54为peerlink接口,52为keeplive口,51、50分别连接两个终端,主备两设备分别下联两个终端。
问题描述
终端2可以分别ping通终端3、4,终端2仅可ping通主设备下联的终端3,ping终端4ping不通。
过程分析
1、查看Guanli-2MAC地址表与arp表,确认可从peerlink接口学习到正确的MAC地址。
display MAC-address
display arp
2、在Guanli-1上带源ping测试。
带x.0.35.254pingxx.20.1.1.5,可以正常通信。
带x.201.0.254pingx.201.1.5,不能正常通信。
3、在peerlink接口两端以及备设备下联口做流统,定位丢包位置。
源为x.201.0.254的报文由主设备发出,备设备收到后丢弃,不进行转发。
解决方法
此问题涉及接口与静态MAC表项匹配检查功能:
设备会将接收到的报文的源MAC地址与静态MAC地址表项进行匹配。 如果存在MAC地址与报文的源MAC相同的表项,但表项的出接口不是接收报文的端口,设备会丢弃该报文。
在双活网关的场景下,主备设备的网关地址是一致的,会导致存在一致的MAC地址表项,报文会丢弃。缺省情况下,报文入接口与静态MAC地址表项匹配检查功能处于开启状态。
为确保三层单播流量转发正常,建议在peer-link链路两端端口上关闭报文入接口与静态MAC地址表项匹配检查功能,即在peer-link接口对应聚合接口上配置undo mac-address static source-check enable命令。
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作