某客户使用我司M9010做为网络出口设备,在使用过程中为了使设备稳定运行,计划性升级版本。
不涉及
在升级后发现M9010割接升级后设备部分板卡未达到稳态。部分板上状态为HA batch backup,如下所示。
<H3CM9010>dis system stable state
System state : Not ready
Redundancy state : Not ready
Chassis Slot CPU Role State
1 4 0 Active Stable
1 0 0 Other Stable
* 1 0 1 Other HA batch backup
1 1 0 Other Stable
* 1 1 1 Other HA batch backup
1 2 0 Other Stable
* 1 2 1 Other HA batch backup
1 3 0 Other Stable
* 1 5 0 Standby HA batch backup
1 6 0 Other Stable
Acl Hw Resource: IFP
======================================
entrynum counternum meternum
total : 2048 1024 1024
total-reserved : 310 128 128
used-reserved : 62 7 1
used-useracl : 1296 9 0
free-useracl : 442 887 896
free-slice : 0 -- --
free-mqc : 221 -- --
free-ofp : 0 -- --
通过命令行发现ofp进程一直处于繁忙状态,导致板卡批量备份状态处于wait状态(ofp进程即为NAT下发流表的OpenFlow进程)
[H3CM9010-probe]dis system internal ha service-group
SG(-instance)-name SU-num Flag Active Action
-------------------------------------------------------------------------------
syslog 5 0300 2080 0
appprofile 5 0300 2080 0
secdiag 5 0300 2080 0
apr 5 0300 2080 0
trange 5 0300 2080 0
lauth 5 0300 2080 0
lagg 5 0300 2080 0
aaa 5 0300 2080 0
ofp 5 1700 2080 1
同时设备还打印了资源不足的提示。
经过排查设备升级前诊断,发现板卡硬件资源已经不足:
Acl Hw Resource: IFP
======================================
entrynum counternum meternum
total : 2048 1024 1024
total-reserved : 310 128 128
used-reserved : 62 7 1
used-useracl : 1296 9 0
free-useracl : 442 887 896
free-slice : 0 -- --
free-mqc : 221 -- --
free-ofp : 0 -- --
通过上述信息分析,设备配置了大量NAT,导致接口卡qacl资源不足,频繁刷新OpenFlow流表,导致设备备主控及三块业务板一直处于opf批量备份繁忙状态而不能达到稳态,此时再undo NAT引流配置并save保存配置,由于备主控尚未达到稳态,保存的配置无法正常平滑到备主控上,导致在后面的几次重启中,主主控是按照关闭NAT引流的配置启动,备主控是按照开启NAT引流的方式启动,由于两块主控加载的启动版本NAT引流已经混乱,导致三块业务板也无法达到稳态。接口卡资源不足从而频繁下刷OpenFlow流表,导致设备备主控及三块业务板一直处于opf批量备份繁忙状态而不能达到稳态。
最后通过清空配置启动,所有板卡达到稳态后再将关闭NAT流表的配置导入并设置为下一次启动配置恢复。
关闭NAT引流,使用MQC手工引流,避免因流表不足导致板卡批量备份失败。
该案例暂时没有网友评论
✖
案例意见反馈
亲~登录后才可以操作哦!
确定你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作