一、核心结论
版本短暂不一致,会影响 M-LAG/DRNI 正常运行,存在业务风险,不建议直接单台重启升级;分场景说明影响、风险、标准升级方案。
设备:H3C M-LAG(DRNI 架构),两台成员设备。
二、版本不一致带来的具体影响
1. 控制层面(M-LAG 邻接 / 协商)
DRNI 邻居协商异常
两台设备固件版本、DRNI 协议报文格式、定时器、状态机存在差异,邻居关系可能断连、反复震荡。
M-LAG 聚合组状态异常
成员端口状态协商失败,聚合口 Up/Down 抖动;
跨设备聚合的下游终端、服务器会出现断网、丢包、端口 flapping。
防环、流量转发逻辑错乱
版本不同导致DARP、DRNI 隔离机制失效,可能出现二层环路、广播风暴。
2. 数据 & 业务层面
单台升级重启期间:M-LAG 分裂(split),双机各自独立转发;
版本短暂不一致阶段:转发表项、ARP/MAC 同步异常,出现单向不通、随机丢包;
若存在三层业务 / 静态路由、OSPF 等,路由表同步也会出错。
3. 补充:ISSU 与普通重启升级区别
普通重启升级(最常用):一台重启→版本不一致→风险极高,M-LAG 基本无法稳定运行;
ISSU 平滑升级:受版本兼容矩阵约束,跨不兼容大版本也会失效,仍会触发邻居断连。
三、官方标准升级顺序(业务尽量无损,必按此执行)
前提:维护窗口操作,提前备份配置、确认集群无告警、链路正常。
步骤 1:升级前准备
导出两台设备完整配置、检查 DRNI 状态
cli
display drni summary
display m-lag summary
display link-aggregation summary
确认升级包 MD5、版本路径一致,两台设备放入同版本 IPE/BIN。
步骤 2:优先使用 ISSU 升级(推荐,断网最短)
适用于同大版本、ISSU 兼容版本:
在主设备执行 ISSU 升级,系统自动同步版本、逐板卡重启,不中断 M-LAG 邻居;
主设备升级完成、运行稳定后,再对备设备执行 ISSU 升级。
限制:若两个版本ISSU 不兼容,此方案不可用,走下面普通升级流程。
步骤 3:ISSU 不兼容 → 普通重启升级(标准稳妥流程)
阶段 1:隔离流量,规避分裂风险
先将所有 M-LAG 下联业务迁移 / 切换至单台设备承载(或业务割离);
可选:临时关闭 DRNI 邻居保活、或人为规避分裂(不建议直接断 DRNI 邻居)。
阶段 2:逐台升级(关键:不同时运行异构版本)
第一台设备(备机):执行升级 + 重启
重启期间,所有 M-LAG 流量全部由另一台主机承接;
等待备机完全启动、版本升级完成。
重点:不要立刻恢复 DRNI/M-LAG
此时两台版本一致后,再恢复邻居协商。
确认双机版本一致、DRNI 邻居正常、聚合口全部 Up。
再对另一台设备重复升级 + 重启。
核心原则:绝不允许两台 M-LAG 设备长期处于版本不一致状态。
步骤 4:全机升级完成后校验
cli
display version # 核对两台版本完全一致
display drni summary # DRNI邻居正常、角色正常
display m-lag summary # M-LAG组状态正常
四、临时风险应对(已经出现版本短暂不一致)
如果已经出现一升一未升、版本不一致:
不要做任何配置修改、不要反复 shutdown 接口;
优先把未升级的设备快速升级到同版本,尽快消除版本差;
若已经出现邻居断、聚合抖动:
等待双机版本统一后,手动 reset drni neighbor 重建邻居;
环路 / 广播风暴:临时在上联 / 下联端口限流、关闭冗余端口,恢复后再放开。
五、精简总结
M-LAG/DRNI 双机版本不一致,必然影响协议协商与转发,存在断网、丢包、环路风险;
优先 ISSU 兼容版本平滑升级,业务影响最小;
ISSU 不兼容:维护窗口逐台重启升级,保证任意时刻不同时运行两个版本;
禁止 “升一台、放着不管,长时间版本错位”。
暂无评论
暂无评论
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作
举报
×
侵犯我的权益
×
侵犯了我企业的权益
×
抄袭了我的内容
×
原文链接或出处
诽谤我
×
对根叔社区有害的内容
×
不规范转载
×
举报说明
暂无评论