M-lag系统无法建立

2026-03-30发表
  • 0收藏

描述

M-lag系统无法建立

一、 开始

m-lag是一种跨设备链路聚合技术,将两台物理设备在聚合层面虚拟成一台设备来实现跨设备链路聚合,从而提供设备级冗余保护和流量负载分担。当遇到m-lag系统无法建立时,具体排查步骤如下:

步骤1检查m-lag系统状态和角色信息;

步骤2确认配置是否完整正确; 

步骤3确认m-lag全局配置一致性检查信息和接口选中信息; 

步骤4查看对端设备的接口信息; 

步骤5查看物理接口状态信息;

步骤6:检查m-lag系统keepalive报文信息; 

步骤7收集m-lag设备之间交互信息,拨打400-810-0504热线寻求帮助

二、 流程图相关操作说明

1、 检查m-lag系统状态和角色信息

执行display m-lag system”命令查看设备上分布式聚合系统信息,该命令显示了IPP接口的状态信息,LocalPeer字段分别显示了本端和对端的系统编号、系统mac地址、系统优先级。执行“display m-lag role”命令,该命令用来查看分布式聚合设备角色信息,包括角色优先级、设备桥mac地址、配置的设备角色和生效的设备角色。正常情况下两条命令回显如下所示。


<Sysname> display m-lag system

                     System information

Local system number: 1                      Peer system number: 2

Local system MAC: 0001-0001-0001            Peer system MAC: 0001-0001-0001

Local system priority: 123                  Peer system priority: 123

Local bridge MAC: 3cd4-3ce1-0200            Peer bridge MAC: 3cd4-437d-0300

Local effective role: Primary               Peer effective role: Secondary

Health level: 0

Standalone mode on split: Enabled

 

In standalone mode: Yes

<Sysname> display m-lag role

                    Effective role information

Factors                          Local                    Peer

Effective role                   Primary                  Secondary

Status of M-LAG uplink interfacesUP                       DOWN

Initial role                     None                     None

MAD DOWN state                   Yes                      Yes

Health level                     0                        0

Role priority                    32768                    32768

Bridge MAC                       3cd4-3ce1-0200           3cd4-437d-0300

Effective role trigger: Peer link calculation

Effective role reason: Bridge MAC

 

                    Configured role information

Factors                          Local                    Peer

Configured role                  Primary                  Secondary

Role priority                    32768                    32768

Bridge MAC                       3cd4-3ce1-0200           3cd4-437d-0300


2、 确认配置是否完整正确

当前面的信息回显不正确时,需要确认m-lag的配置是否确认,查看两端设备配置的系统编号、系统mac和系统优先级。在同一个分布式聚合系统中,所有的分布式聚合设备必须配置不同的系统编号。

为了能够让对端设备将分布式聚合组中的两台设备看成一台设备,需要同一分布式聚合组中所有DR设备的系统MAC地址配置相同。当分布式系统两边设备的系统mac配置一边没有配置时,没配置的一边IPP接口状态显示为down对端的系统编号、系统mac地址、系统优先级都显示为N/A并且本端的系统mac地址也会显示为N/A

[DeviceA] m-lag system-mac 1-1-1

[DeviceA] m-lag system-number 1

[DeviceA] m-lag system-priority 123


[DeviceB] m-lag system-mac 1-1-1

[DeviceB] m-lag system-number 2

[DeviceB] m-lag system-priority 123

在分布式聚合组正常工作的情况下,为了能够让对端设备将分布式聚合组中的两台设备看成一台设备,在与对端设备交互聚合组信息时,LACPDU中系统LACP优先级为配置的分布式聚合系统优先级,因此两端配置必须一致。当两端系统优先级不一致时,IPP接口状态为down,对端的系统编号、系统mac地址、系统优先级都显示为N/A


 


 

在设备上执行interface bridge-aggregation IPP口所对应的二层聚合口编号”命令,进入二层聚合口查看配置,port m-lag intra-portal-port port-id这条命令是将二层聚合接口配置为IPP口,port-id表示IPP端口索引,只能取值为1,因为每台DR设备上只能配置一个IPP口。

[DeviceA]interface bridge-aggregation 3

[DeviceA-Bridge-Aggregation3]display this

#

interface Bridge-Aggregation3

 link-aggregation mode dynamic

 port m-lag intra-portal-port 1

#


在设备上执行interface bridge-aggregation DR口所对应的二层聚合口编号”命令,进入二层聚合口查看配置,port m-lag group group-id这条命令用来配置聚合接口加入分布式聚合组,group-id取值范围为11024。如果当前二层聚合接口已经配置为IPP口,则不允许再将其配置为DR口。一个二层聚合接口只能加入一个分布式聚合组。


 [DeviceA]interface bridge-aggregation 4

[DeviceA-Bridge-Aggregation4]display this

#

interface Bridge-Aggregation4

 link-aggregation mode dynamic

 port m-lag group 4

#

return

3、 确认m-lag全局配置一致性检查信息和接口选中信息

在设备上执行display m-lag summary”命令,该命令用来显示m-lag的接口摘要信息,包含IPP接口和DR接口的摘要信息,以及Type 1类型接口配置一致性检查结果,正确情况如下所示。

<DeviceA> display m-lag summary

<Sysname> display m-lag summary

Flags: A -- Aggregate interface down, B -- No peer M-LAG interface configured

       C -- Configuration consistency check failed

       D –- Standby status in active/standby mode

 

Peer-link interface: BAGG3

Peer-link interface state (cause): UP

Keepalive link state (cause): UP

 

                     M-LAG interface information

M-LAG IF    M-LAG group  Local state (cause)  Peer state  Remaining down time(s)

BAGG4       4            UP                   UP   


在设备上执行display m-lag verbose”命令,该命令用来显示分布式聚合系统的接口详细信息,其中FlagDRCP协议的状态标志,长度为1字节,该字节自低位至高位分别以字母AH表示,取值为1的标志位显示为对应的字母,取值为0的标志为不显示。A为本端设备DRCP是否开启标志,1表示开启;0表示关闭。B为邻居设备DRCP是否开启标志,1表示开启;0表示关闭。C为其他邻居设备DRCP是否开启标志,1表示开启;0表示关闭。D为本端设备IPP端口认为邻居设备DRCP是否处于开启状态,1表示是;0表示否。EDRCP/短超时标志,1表示短超时;0表示长超时。F为本端设备认为IPP端口是否可以通过指定网关会话ID的报文,1表示是;0表示否。G为本端设备认为IPP端口是否可以通过指定端口会话ID的报文,1表示是;0表示否。H为本端设备的接收状态机是否处于默认状态或超时状态,1表示是;0表示否。正常情况如下所示。


 显示二层聚合接口1所对应M-LAG接口的详细信息。

<Sysname> display m-lag verbose interface bridge-aggregation 1

Flags: A -- Home_Gateway, B -- Neighbor_Gateway, C -- Other_Gateway,

       D -- PeerLink_Activity, E -- DRCP_Timeout, F -- Gateway_Sync,

       G -- Port_Sync, H -- Expired

 

M-LAG interface/M-LAG group ID: BAGG1/1

Local M-LAG interface state: UP

Peer M-LAG interface state: UP

M-LAG group state: UP

Local M-LAG role election type: ARP

Peer M-LAG role election type: ARP

Local M-LAG interface role: Standby

Peer M-LAG interface role: Standby

Local M-LAG interface down cause: -

Remaining M-LAG DOWN time: -

Local M-LAG interface LACP MAC: COnfig=0001-0001-0001, Effective=0001-0001-0001

Peer M-LAG interface LACP MAC: COnfig=0001-0001-0001, Effective=0001-0001-0001

Local M-LAG interface LACP priority: COnfig=200, Effective=200

Peer M-LAG interface LACP priority: COnfig=200, Effective=200

Local DRCP flags/Peer DRCP flags: ABDFG/ABDFG

Local Selected ports (index): GE1/0/1 (1), GE1/0/2 (2)

Peer Selected ports indexes: 260, 261

显示二层聚合接口2所对应的peer-link接口的详细信息。

<Sysname> display m-lag verbose interface bridge-aggregation 2

Flags: A -- Home_Gateway, B -- Neighbor_Gateway, C -- Other_Gateway,

       D -- PeerLink_Activity, E -- DRCP_Timeout, F -- Gateway_Sync,

       G -- Port_Sync, H -- Expired

 

Peer-link interface/Peer-link interface ID: BAGG2/1

State: UP

Cause: -

Local DRCP flags/Peer DRCP flags: ABDFG/ABDFG

Local Selected ports (index): GE1/0/1 (1), GE1/0/2 (2)

Peer Selected ports indexes: 258, 259

Reserved VLANs: 1, 3-10


4、查看对端设备的接口信息

在设备上执行display link-aggregation verbose”命令,该命令用来查看连接对端设备的聚合接口所对应聚合组的详细信息,FlagsLACP协议的状态标志,长度为1字节,该字节自低位至高位分别以字母AH表示,取值为1的标志位显示为对应的字母,取值为0的标志为不显示。ALACP是否开启标志,1表示开启;0表示关闭。BLACP/短超时标志,1表示短超时;0表示长超时。C为发送端认为本成员端口所在链路是否可聚合,1表示是;0表示否。D为发送端认为本成员端口所在链路是否处于同步状态,1表示是;0表示否。E为发送端认为本成员端口所在链路是否处于收集状态,1表示是;0表示否。F为发送端认为本成员端口所在链路是否处于分发状态,1表示是;0表示否。  G为发送端的接收状态机是否处于默认状态,1表示是;0表示否。H为发送端的接收状态机是否处于超时状态,1表示是;0表示否。正常情况如下所示。


 Sysname> display link-aggregation verbose bridge-aggregation 10

Loadsharing Type: Shar -- Loadsharing, NonS -- Non-Loadsharing

Port Status: S -- Selected, U -- Unselected, I -- Individual

Port: A -- Auto port, M -- Management port, R -- Reference port

Flags:  A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,

        D -- Synchronization, E -- Collecting, F -- Distributing,

        G -- Defaulted, H -- Expired

 

Aggregate Interface: Bridge-Aggregation10

Creation Mode: Manual

Aggregation Mode: Dynamic

Loadsharing Type: Shar

Management VLANs: None

System ID: 0x8000, 000f-e267-6c6a

Local:

  Port                Status   Priority Index    Oper-Key               Flag

  XGE1/0/1            S        32768    61       2                      {ACDEF}

  XGE1/0/2            S        32768    62       2                      {ACDEF}

Remote:

  Actor               Priority Index    Oper-Key SystemID               Flag

  XGE1/0/1(R)         32768    111      2        0x8000, 000f-e267-57ad {ACDEF}

  XGE1/0/2            32768    112      2        0x8000, 000f-e267-57ad {ACDEF}

 

5、查看物理接口状态信息

在设备上执行display interface xxx”命令,xxx表示加入IPP接口和DR接口的物理接口编号,该命令可以用来查询分布式聚合系统相关物理接口的状态信息,包含物理状态信息和协议状态信息,可以尝试相邻设备互ping,观察接口是否有错包,以此确认二层链路是否正常。需要指出的是,当系统编号或系统mac地址两端不一致时,DR接口组中的物理接口会显示为物理up、协议down状态,且协议down的原因为Link-Aggregation interface down


 [DeviceA]display interface Ten-GigabitEthernet 2/0/16///该接口为DR接口组中的物理接口

Ten-GigabitEthernet2/0/16

Current state: DOWN ( Link-Aggregation interface down )

Line protocol state: DOWN(LAGG)

6检查m-lag系统keepalive报文信息

在设备上执行display m-lag keepalive”命令,该命令用来查看分布式聚合Keepalive链路的信息。缺省情况下,Keepalive报文发送的时间间隔为1000毫秒,超时时间间隔为5秒。本端DR设备的Keepalive报文超时时间必须配置成对端DR设备的Keepalive报文发送时间间隔的2倍以上。当本端发送间隔超过对端超时时间,keepalive链路状态会在updown之间频繁切换。


 <DeviceA> display m-lag keepalive

Neighbor keepalive link status: Up

Neighbor is alive for: 135642 s 501 ms

Last keepalive packet sending status: Successful

Last keepalive packet sending time: 2017/03/18 18:23:53 986 ms

Last keepalive packet receiving status: Successful

Last keepalive packet receiving time: 2017/03/18 18:23:54 99 ms

 

Distributed relay keepalive parameters:

Destination IP address: 10.0.0.2

Source IP address: 10.0.0.1

Keepalive UDP port : 6400

Keepalive VPN name : vpn1

Keepalive interval : 1000 ms

Keepalive timeout  : 5 sec

Keepalive hold time: 3 sec

7收集m-lag设备之间交互信息

 

   在设备上执行debug m-lag all”命令,该命令用来打开m-lag模块的调试开关,可以看到两端交互的DRCPDU报文和keepalive报文。在设备上执行“debug link-aggregation lacp packet all”命令,该命令用来打开LACP模块的调试开关。做了以上操作,还不能解决问题,请收集上述debug信息、相关设备的诊断信息、日志信息、诊断日志、详细组网,然后拨打400-810-0504热线寻求帮助。

 

 

常见故障现象

两台交换机做mlag1为主,2为备。5354peerlink接口,52keeplive,5150分别连接两个终端,主备两设备分别下联两个终端。

 

问题描述

终端2可以分别ping通终端34,终端2仅可ping通主设备下联的终端3ping终端4ping不通。

 

过程分析

1、查看Guanli-2MAC地址表与arp表,确认可从peerlink接口学习到正确的MAC地址。

 

  display MAC-address

 

  display arp

 

2、在Guanli-1上带源ping测试。

 

  x.0.35.254pingxx.20.1.1.5,可以正常通信。

 

  x.201.0.254pingx.201.1.5,不能正常通信。

 

3、在peerlink接口两端以及备设备下联口做流统,定位丢包位置。

 

  源为x.201.0.254的报文由主设备发出,备设备收到后丢弃,不进行转发。

 

解决方法

此问题涉及接口与静态MAC表项匹配检查功能:

 

设备会将接收到的报文的源MAC地址与静态MAC地址表项进行匹配。 如果存在MAC地址与报文的源MAC相同的表项,但表项的出接口不是接收报文的端口,设备会丢弃该报文。

 

在双活网关的场景下,主备设备的网关地址是一致的,会导致存在一致的MAC地址表项,报文会丢弃。缺省情况下,报文入接口与静态MAC地址表项匹配检查功能处于开启状态。

 

为确保三层单播流量转发正常,建议在peer-link链路两端端口上关闭报文入接口与静态MAC地址表项匹配检查功能,即在peer-link接口对应聚合接口上配置undo mac-address static source-check enable命令。

 

 


提出建议

    +

亲~登录后才可以操作哦!

确定

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作