Print

小贝优选——交换机常用IRF升级步骤总结

2025-01-24 发表

组网及说明

IRF (Intelligent Resilient Framework) 是将多台设备虚拟化成⼀台设备,从⽽集合多台设备的硬件资源和软件处理能⼒,实现多台设备的协同⼯作。

实际运维过程中,经常会遇到需要升级IRF设备软件版本的情况,下面为IRF升级具体的操作过程。

此案例适用于小贝优选中的US300,US500,US600系列交换机。

配置步骤

 

一、升级前准备工作

1.全程记录操作日志

IRF升级时建议全程记录操作日志,便于及时发现问题及分析定位。

2.设备NSR配置检查

由于堆叠设备会涉及到主备倒换,存在路由协议的话可能导致协议邻居震荡,可以通过配置NSR提升可靠性。

3.检查主从优先级

因为升级过程中需要拆堆叠,为避免升级过程中受到IRF优先级的影响,建议在升级前检查堆叠成员设备的优先级,确保主设备优先级高于从设备,并保存配置。

如升级操作需变更主从关系,需先升级期望为主的设备,升级前配置该设备IRF优先级高于另外一台,并保存配置。

4.检查是否存在单挂业务链路

因为升级过程中需要拆堆叠并关闭单框业务接口,所以需检查是否存在单挂业务,如果存在,会导致单挂业务升级时访问异常,建议提前进行业务迁移或增加备份链路。

5.堆叠、协议状态检查及信息收集

堆叠升级前需要对设备单板状态、HA状态、堆叠状态及MAD状态进⾏检查,确保堆叠及MAD状态正常,具体命令回显参数可参考命令⼿册说明。

IRF 设 备 上 所 有 单 板 的 State 状 态 必 须 为 Stable,即稳态,除Stable外的其他状态均需确认原因,在恢复为Stable状态之前禁⽌进⾏IRF升级操 作。

如上举例中 HA batch backupHA批量备份中,异常状态,其他状态说明参考命令⼿册。

之后检查堆叠设备协议、端⼝、表项等状态是否正常,并进⾏相关表项信息收集,⽅便与升级后对⽐检查,如下列出常⽤信息收集命令,具体可根据设备应⽤进⾏相关状态及信息收集。

6.设备配置备份

设备状态检查均正常,设备具备升级条件下,保存配置,并将配置导出进行备份。

7.检查设备Flash空间并上传版本文件

使用dir命令查看设备当前系统文件,确认启动文件及配置文件名以及Flash的剩余空间,保证Flash有足够空间放入新的启动文件。

上传⽬标软件版本⾄设备,并通过MD5命令及MD5⼯具检查确认版本⽂件的完整性。

对⽐MD5命令及MD5⼯具⽣成的MD5值是否一致。

将软件程序⽂件copy到其他主控板。

8. 指定⽬标版本并检查

⾸先指定⽬标版本⽂件类型为main,为主启动软件程序。然后通过display boot-loader确认所有主控引擎的下⼀次设备重启的主启动软件程序是否为⽬标软件版本。

二、IRF升级中

1.关闭MAD功能

此处以BFD MAD为例,关闭BFD MAD检测功能,并将BFD MAD线路拔掉 

2. 关闭期望主设备业务端⼝并保存配置

关闭期望主设备上的所有上⾏及下⾏业务端⼝ (IRF端⼝除外),这⾥以Chassis 1作为期望主设备,Chassis 2作为期望从设备举例,关闭后验证业务是否有影响,此时需要做连通性测试确定⽹络是否可⽤(配置脚本提前写好,直接下发)。 

确保业务成功切到另一台设备上,并测试正常,此时save保存配置

3. 重启主设备,并拔堆叠线 

重启主设备Chassis 1,重启命令执⾏后,进⾏堆叠线路的拆除,保证在设备启动完成前拆除完毕。

注意:该步骤堆叠分裂情况下,主设备和备设备上务必不能执⾏保存配置的操作,否则会引起配置丢失。

4. 关闭从设备业务⼝,再打开主设备业务⼝

待 主 设 备 Chassis 1 启 动 完 成 , 在主设备Chassis 1上⽤display device确认所有单板状态为 Normal,并且⽤display interface能够看到所有物理接⼝后,延迟2分钟,通过提前准备的脚本将从设备的上下⾏业务接⼝关闭,再将主设备上下⾏业务接⼝打开,即关闭从设备业务接⼝后⽴即执⾏打开主设备业务接⼝的操作,间隔时间越短,业务中断时间越短。

注意:该步骤堆叠分裂情况下,主设备和备设备上务必不能执⾏保存配置的操作,否则会引起配置丢失。

5. 重启从设备并恢复堆叠链路 

检查业务是否正常切到升级后的1框主设备,确认业务正常后,进⾏2框从设备的重启操作,注意此处⼀定不能保存配置(重启时会提⽰是否保存当前配置)。

重启命令执⾏后,在2框从设备重启完成之前将堆叠链路重新连接。

注意:该步骤堆叠分裂情况下,主设备和备设备上务必不能执⾏保存配置的操作,否则会引起配置丢失。

三、IRF升级后检查工作

1. 堆叠状态及业务检查 

2框从设备重启完成后,检查堆叠状态是否正常,业务是否正常。

2. 恢复MAD功能及状态检查并保存配置

恢复MAD功能,并检查MAD状态。

堆叠状态及MAD状态检查正常后,可根据需要进⾏⽆⽤配置(⽐如:range 接⼝)删除并保存配置。 

3. 设备状态检查及升级前后对⽐ 

升级完成,进⾏相关表项信息收集,与升级前进⾏对⽐检查,如下列出常⽤信息收集命令,具体可根据设备应⽤进⾏相关状态及信息收集。

 


配置关键点

注意事项:

1. 升级前IRF设备上所有单板的State状态必须为Stable稳态,除Stable外的其他状态均需确认原因,在恢复为Stable状态之前禁⽌进⾏IRF升级操作。

2. IRF升级操作中,先对期望为主的设备进行升级,并确保升级前该设备的IRF优先级⾼于其他成员设备。

3. 通过提前写好的配置脚本关闭和打开上下⾏业务接⼝,请注意检查脚本包含所有业务接⼝,避免遗漏导致升级过程中出现异常。

4. 在堆叠分裂的情况下,禁⽌在任何⼀台IRF成员设备上执⾏Save命令。

5. 主设备启动完成后,需检查所有单板状态恢复正常,确认所有接⼝都可看到后,延迟2分钟,再进⾏下⼀步操作。

6. 从设备重启后,必须在从设备重启完成之前将堆叠链路重新连接。