m-lag restore-delay 配置的延迟时间后才能 UP,建议在延迟时间过后再开启业务端口。
M-LAG(DRNI)设备整机替换 / 割接 完整操作步骤
以两台主备 / 双活 M-LAG 堆叠组(Device A、Device B) 整机替换为例,分单台逐台割接(生产标准方案,业务不中断)、双机同时替换(停机割接),优先推荐逐台平滑割接。
前提:两台设备为标准 H3C DRNI/M-LAG 双机架构,下联业务端口、上联端口、M-LAG 聚合口、DRNI 控制链路、聚合备份链路均正常,割接前全量备份配置。
一、先理清 M-LAG 割接核心原则
M-LAG 双机热备,支持单台在线替换,另一台承接全部流量,业务无中断;
严禁两台 M-LAG 成员机同时断电 / 下线(会导致所有 M-LAG 端口断流、二层环路);
新设备硬件、固件版本必须和对端现有 M-LAG 设备一致,避免兼容性问题;
割接顺序:先拆单机 → 换新设备 → 导配置 → 加回 M-LAG 组 → 校验 → 再割接另一台。
基础术语(对照)
DRNI 主备组:两台 M-LAG 成员设备
DRCP 链路:M-LAG 控制协商链路(直连 / 聚合)
IPP 链路:设备间跨板转发备份链路(心跳 + 数据)
M-LAG 聚合组:下联终端 / 接入设备的跨设备聚合口
DRNI System ID/DRNI Group:M-LAG 全局组标识
二、场景一:7×24 业务不中断 → 逐台平滑割接(主流生产方案)
拓扑:Device A + Device B 组成 M-LAG 组,计划依次替换为 New-A、New-B
阶段 1:割接前准备(必做,所有步骤执行)
全量备份两台老设备配置
bash
运行
save
tftp x.x.x.x put flash:/startup.cfg
display current-configuration # 另存文本备查
记录关键信息(新设备必须沿用)
DRNI 组号、System ID、DRNI 优先级
IPP 接口、DRCP 接口、设备间互联链路
所有 M-LAG 聚合组编号、端口成员、聚合模式
VLAN、三层接口、路由、ACL、策略、版本型号
新设备预配置(离线 / 单独上电配置)
新设备先不接入现网,单独上电:
升级固件、补丁,版本与在线老设备完全一致
导入老设备完整配置(Startup.cfg)
修改设备名称、管理 IP(和原被替换设备一致)
检查 DRNI、M-LAG、IPP、DRCP 配置完整,无报错
关闭新设备所有物理端口(interface all / undo port enable),防止上电后乱转发
现网状态检查
bash
运行
display drni summary # 确认双机DRNI状态正常、角色正常
display link-aggregation summary # 所有M-LAG聚合口UP、负载正常
display drni neighbor # DRNI邻居状态正常
阶段 2:第一台设备替换(示例:先替换 Device A → New-A)
此时 Device B 全程在线,承载全部业务流量
步骤 1:把 Device A 优雅退出 M-LAG 组(平滑下线)
登录 Device A,逐步弱化流量、关闭 M-LAG 相关能力
bash
运行
# 1. 调低DRNI优先级,让Device B永久成为主设备(防止角色切换震荡)
drni group 1 priority 0
# 2. 逐个关闭本机M-LAG成员端口(或直接shutdown所有业务口)
interface range 所有M-LAG物理端口、上联口、下联口
shutdown
quit
# 3. 关闭IPP、DRCP链路接口
interface IPP接口/DRCP直连接口
shutdown
quit
校验:display drni summary → Device A 状态变为 Down / 邻居断开,所有流量完全切到 Device B。
步骤 2:断电拆旧设备、上架新设备 New-A
确认流量全在 B 设备后,断开 Device A 电源,拆除线缆;
上架新设备 New-A,按原线序接好:管理口、DRNI 互联线、所有业务线、上联 / 下联线;
新设备暂时不上电。
步骤 3:新设备 New-A 上电、接入 M-LAG 组
给 New-A 上电,设备启动(配置已提前导入);
依次启用接口(先互联链路,再业务口)
bash
运行
# 1. 先启用 IPP、DRCP 设备间互联接口(关键,先建邻居)
interface IPP/DRCP接口
port enable
quit
# 2. 等待DRNI邻居协商成功
display drni neighbor # 查看和Device B邻居UP
# 3. 恢复DRNI优先级(和原来规划一致)
drni group 1 priority 原优先级
# 4. 批量启用所有业务端口、M-LAG成员端口、上联口
interface range 所有业务端口
port enable
quit
步骤 4:校验双机 M-LAG 状态 & 业务
bash
运行
display drni summary # 双机DRNI正常、角色正确
display link-aggregation summary # 所有M-LAG聚合口全UP
display drni m-lag summary # M-LAG组状态正常
流量逐步双机分担,业务无断流;
抓包、ping 业务地址,确认终端上网、跨层转发正常。
阶段 3:第二台设备替换(替换 Device B → New-B)
逻辑和上面完全一致,此时 New-A 在线承载全部流量:
登录原 Device B,调低 DRNI 优先级 → 关闭所有业务口、互联口;
断电下架老 B,上架预配置好的 New-B,接好所有线缆;
New-B 上电 → 启用互联接口(和 New-A 建 DRNI 邻居)→ 恢复优先级 → 启用所有业务端口;
全面校验 DRNI、M-LAG、聚合、流量、业务。
三、场景二:允许业务停机 → 双机整体割接(深夜 / 凌晨停机窗口)
适用于业务可短时间中断、整机集群整体替换:
停机通知,全网停止业务;
两台老设备 同时断电,拆除所有线缆;
上架两台新设备,按原拓扑接好所有线缆(互联线、业务线、上联线);
两台新设备分别导入对应配置,核对版本、DRNI/M-LAG 参数;
两台新设备同时上电,等待系统启动、DRNI 邻居协商完成;
检查 DRNI、M-LAG、聚合、VLAN、路由,逐业务验证,恢复上线。
四、割接关键风险点 & 避坑方案(高频踩坑)
1. 版本不兼容(最高发)
现象:新设备加入后 DRNI 邻居起不来、M-LAG 端口 Err-Down;
解决:新设备固件、补丁、Bootrom 必须和在线设备完全一致。
2. 线序插错
现象:IPP/DRCP 互联口接错 → 邻居断、M-LAG 分裂;
解决:贴标签,严格按照原有线序恢复。
3. 未提前关闭端口,新设备上电触发环路
现象:端口频繁 UP/DOWN、广播风暴、业务卡顿;
解决:新设备预配置阶段全部端口 shutdown,再逐口启用。
4. DRNI System ID / Group ID 不一致
现象:无法建立 DRNI 邻居;
解决:新设备完全沿用老设备 drni group X、drni system-id 配置。
5. 割接中手动切换主备,导致流量震荡
解决:割接期间固定一台为主设备,不动态切换优先级。
五、割接后必做验收命令(全套)
在两台新 M-LAG 设备上分别执行:
bash
运行
# 1. DRNI整体状态
display drni summary
display drni neighbor
# 2. M-LAG聚合组状态
display drni m-lag summary
display link-aggregation summary
# 3. 接口、VLAN、三层
display interface brief
display vlan brief
# 4. 路由、会话、业务连通性
display ip routing-table
ping 网关/上联/终端地址
六、极简操作总结(记忆版)
不停机逐台替换标准流程
备份配置、记录参数、新设备同版本 + 预导入配置、全端口 shutdown;
待替换老设备:降优先级 → 关业务口 → 关互联口 → 下线;
换硬件、接线缆,新设备上电;
新设备先启互联接口建 DRNI 邻居 → 恢复优先级 → 启业务口;
校验状态,再用同样方法割接另一台。
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论