• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

设备割接+M-lag技术

6小时前提问
  • 0关注
  • 0收藏,37浏览
chnke 零段
粉丝:0人 关注:0人

问题描述:

各位大佬,请问一下网络设备割接时,如果设备做了M-lag的设备,这种应该怎么来进行替换,能讲一下具体的操作步骤吗?

2 个回答
粉丝:21人 关注:1人

在进行 M-LAG(跨设备链路聚合)网络割接与故障设备替换时,核心原则是“先隔离、再替换、后恢复”,以确保业务流量能够平滑过渡到另一台正常的 M-LAG 设备上。

第一步:准备工作

  1. 备份配置与状态:如果故障设备仍可运行,请保存并下载其配置文件;若已不可运行,需从备份平台获取配置,并与正常运行的另一台 M-LAG 设备进行比对,确保配置一致。
  2. 准备新设备:确认新设备的型号和软件版本与在网设备保持一致(部分厂商如华为要求确认款型支持 M-LAG),并将新设备的所有物理端口预先关闭或直接下电。

第二步:隔离故障设备

为了安全地移除故障设备,需切断其与网络的连接,防止异常报文影响整体网络:
  • 方式一(推荐):通过命令行关闭故障设备上的所有物理接口。
  • 方式二:若待替换设备较多或无法登录设备,建议直接对故障设备进行下电处理。

第三步:执行物理替换

  1. 下架旧机:在业务变更窗口内,将故障设备关电下架(此操作会造成业务瞬时闪断,非敏感业务通常可忽略)。
  2. 上架新机:将准备好的新设备原位上架,并在非上电或全部物理端口关闭的状态下连接好线缆。

第四步:导入配置并启动

  1. 导入配置:将之前备份的配置文件导入到新设备中。注意: 必须检查并删除原故障设备可能存在的应急处理配置(如被手动 shutdown 的接口、临时部署的流量统计功能等)。
  2. 指定版本与重启:在新设备上指定正确的系统版本文件和配置文件,然后重启设备使其生效。

第五步:恢复物理连接(关键顺序)

当新设备启动完成且配置生效后,需严格按照以下顺序开启物理端口,以避免 M-LAG 系统发生脑裂或次生故障:
  1. 首先开启 peer-link 链路的物理端口;
  2. 其次开启 keepalive 链路的物理端口;
  3. 最后开启所有业务端口(必须先开启上行端口,再开启下行端口)。
    注:开启 peer-link 后,M-LAG 系统会重新形成,业务端口通常需要等待 m-lag restore-delay 配置的延迟时间后才能 UP,建议在延迟时间过后再开启业务端口。

第六步:验证业务与表项

  1. 核对表项:对比升级/替换前后的路由表、FIB 表、MAC 地址表等,确认无丢失。
  2. 检查流量:对比新旧设备的业务流量是否一致,确认服务器等终端能否正常运行。
  3. 控制器状态:如果网络有控制器(如 iMaster NCE-Campus),需检查控制器的连接状态是否恢复为 Established。

暂无评论

粉丝:15人 关注:2人

M-LAG(DRNI)设备整机替换 / 割接 完整操作步骤
以两台主备 / 双活 M-LAG 堆叠组(Device A、Device B) 整机替换为例,分单台逐台割接(生产标准方案,业务不中断)、双机同时替换(停机割接),优先推荐逐台平滑割接。
前提:两台设备为标准 H3C DRNI/M-LAG 双机架构,下联业务端口、上联端口、M-LAG 聚合口、DRNI 控制链路、聚合备份链路均正常,割接前全量备份配置。
一、先理清 M-LAG 割接核心原则
M-LAG 双机热备,支持单台在线替换,另一台承接全部流量,业务无中断;
严禁两台 M-LAG 成员机同时断电 / 下线(会导致所有 M-LAG 端口断流、二层环路);
新设备硬件、固件版本必须和对端现有 M-LAG 设备一致,避免兼容性问题;
割接顺序:先拆单机 → 换新设备 → 导配置 → 加回 M-LAG 组 → 校验 → 再割接另一台。
基础术语(对照)
DRNI 主备组:两台 M-LAG 成员设备
DRCP 链路:M-LAG 控制协商链路(直连 / 聚合)
IPP 链路:设备间跨板转发备份链路(心跳 + 数据)
M-LAG 聚合组:下联终端 / 接入设备的跨设备聚合口
DRNI System ID/DRNI Group:M-LAG 全局组标识
二、场景一:7×24 业务不中断 → 逐台平滑割接(主流生产方案)
拓扑:Device A + Device B 组成 M-LAG 组,计划依次替换为 New-A、New-B
阶段 1:割接前准备(必做,所有步骤执行)
全量备份两台老设备配置
bash
运行
save
tftp x.x.x.x put flash:/startup.cfg
display current-configuration # 另存文本备查
记录关键信息(新设备必须沿用)
DRNI 组号、System ID、DRNI 优先级
IPP 接口、DRCP 接口、设备间互联链路
所有 M-LAG 聚合组编号、端口成员、聚合模式
VLAN、三层接口、路由、ACL、策略、版本型号
新设备预配置(离线 / 单独上电配置)
新设备先不接入现网,单独上电:
升级固件、补丁,版本与在线老设备完全一致
导入老设备完整配置(Startup.cfg)
修改设备名称、管理 IP(和原被替换设备一致)
检查 DRNI、M-LAG、IPP、DRCP 配置完整,无报错
关闭新设备所有物理端口(interface all / undo port enable),防止上电后乱转发
现网状态检查
bash
运行
display drni summary # 确认双机DRNI状态正常、角色正常
display link-aggregation summary # 所有M-LAG聚合口UP、负载正常
display drni neighbor # DRNI邻居状态正常
阶段 2:第一台设备替换(示例:先替换 Device A → New-A)
此时 Device B 全程在线,承载全部业务流量
步骤 1:把 Device A 优雅退出 M-LAG 组(平滑下线)
登录 Device A,逐步弱化流量、关闭 M-LAG 相关能力
bash
运行
# 1. 调低DRNI优先级,让Device B永久成为主设备(防止角色切换震荡)
drni group 1 priority 0

# 2. 逐个关闭本机M-LAG成员端口(或直接shutdown所有业务口)
interface range 所有M-LAG物理端口、上联口、下联口
shutdown
quit

# 3. 关闭IPP、DRCP链路接口
interface IPP接口/DRCP直连接口
shutdown
quit
校验:display drni summary → Device A 状态变为 Down / 邻居断开,所有流量完全切到 Device B。
步骤 2:断电拆旧设备、上架新设备 New-A
确认流量全在 B 设备后,断开 Device A 电源,拆除线缆;
上架新设备 New-A,按原线序接好:管理口、DRNI 互联线、所有业务线、上联 / 下联线;
新设备暂时不上电。
步骤 3:新设备 New-A 上电、接入 M-LAG 组
给 New-A 上电,设备启动(配置已提前导入);
依次启用接口(先互联链路,再业务口)
bash
运行
# 1. 先启用 IPP、DRCP 设备间互联接口(关键,先建邻居)
interface IPP/DRCP接口
port enable
quit

# 2. 等待DRNI邻居协商成功
display drni neighbor # 查看和Device B邻居UP

# 3. 恢复DRNI优先级(和原来规划一致)
drni group 1 priority 原优先级

# 4. 批量启用所有业务端口、M-LAG成员端口、上联口
interface range 所有业务端口
port enable
quit
步骤 4:校验双机 M-LAG 状态 & 业务
bash
运行
display drni summary # 双机DRNI正常、角色正确
display link-aggregation summary # 所有M-LAG聚合口全UP
display drni m-lag summary # M-LAG组状态正常
流量逐步双机分担,业务无断流;
抓包、ping 业务地址,确认终端上网、跨层转发正常。
阶段 3:第二台设备替换(替换 Device B → New-B)
逻辑和上面完全一致,此时 New-A 在线承载全部流量:
登录原 Device B,调低 DRNI 优先级 → 关闭所有业务口、互联口;
断电下架老 B,上架预配置好的 New-B,接好所有线缆;
New-B 上电 → 启用互联接口(和 New-A 建 DRNI 邻居)→ 恢复优先级 → 启用所有业务端口;
全面校验 DRNI、M-LAG、聚合、流量、业务。
三、场景二:允许业务停机 → 双机整体割接(深夜 / 凌晨停机窗口)
适用于业务可短时间中断、整机集群整体替换:
停机通知,全网停止业务;
两台老设备 同时断电,拆除所有线缆;
上架两台新设备,按原拓扑接好所有线缆(互联线、业务线、上联线);
两台新设备分别导入对应配置,核对版本、DRNI/M-LAG 参数;
两台新设备同时上电,等待系统启动、DRNI 邻居协商完成;
检查 DRNI、M-LAG、聚合、VLAN、路由,逐业务验证,恢复上线。
四、割接关键风险点 & 避坑方案(高频踩坑)
1. 版本不兼容(最高发)
现象:新设备加入后 DRNI 邻居起不来、M-LAG 端口 Err-Down;
解决:新设备固件、补丁、Bootrom 必须和在线设备完全一致。
2. 线序插错
现象:IPP/DRCP 互联口接错 → 邻居断、M-LAG 分裂;
解决:贴标签,严格按照原有线序恢复。
3. 未提前关闭端口,新设备上电触发环路
现象:端口频繁 UP/DOWN、广播风暴、业务卡顿;
解决:新设备预配置阶段全部端口 shutdown,再逐口启用。
4. DRNI System ID / Group ID 不一致
现象:无法建立 DRNI 邻居;
解决:新设备完全沿用老设备 drni group X、drni system-id 配置。
5. 割接中手动切换主备,导致流量震荡
解决:割接期间固定一台为主设备,不动态切换优先级。
五、割接后必做验收命令(全套)
在两台新 M-LAG 设备上分别执行:
bash
运行
# 1. DRNI整体状态
display drni summary
display drni neighbor

# 2. M-LAG聚合组状态
display drni m-lag summary
display link-aggregation summary

# 3. 接口、VLAN、三层
display interface brief
display vlan brief

# 4. 路由、会话、业务连通性
display ip routing-table
ping 网关/上联/终端地址
六、极简操作总结(记忆版)
不停机逐台替换标准流程
备份配置、记录参数、新设备同版本 + 预导入配置、全端口 shutdown;
待替换老设备:降优先级 → 关业务口 → 关互联口 → 下线;
换硬件、接线缆,新设备上电;
新设备先启互联接口建 DRNI 邻居 → 恢复优先级 → 启业务口;
校验状态,再用同样方法割接另一台。

暂无评论

编辑答案

你正在编辑答案

如果你要对问题或其他回答进行点评或询问,请使用评论功能。

分享扩散:

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作

举报

×

侵犯我的权益 >
对根叔社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明