Print

关于H3C M9000系列多业务安全网关软件内部管理通道异常相关问题的公告

2016-07-18 发表

M9000产品加电运行过程中,出现运行状态异常,包括但不限于SNMP无法管理、ACL无法配置、接口状态异常等。

部分故障现象举例说明如下:

1snmpd进程挂死,设备无法通过SNMP远程管理,转发业务未受影响。

2aclmgrd进程挂死,设备无法新增ACL配置,转发业务未受影响。

3fsdifmgrdevd等关键进程挂死,导致OSPF邻居Down,影响业务转发。

4ifmgr接口管理进程异常挂死,管理员无法查看设备接口统计信息,且无法在接口下修改配置,转发业务未受影响。

5kifupdown进程挂死,导致接口状态与对端不一致,物理层Up,协议层为Down,转发业务未受影响。

M9000产品系统软件内部使用LIPC通道进行控制平面通信。当该通道出现异常时,将引起相关软件模块进程挂死。该问题自M9000加电启动后即存在概率发生,与配置、运行时间无关,可能影响的软件模块包括但不限于SNMPACL、接口管理等。

现场M9000设备可通过以下方法提前进行问题判断:

1、登录M9000命令行,进入Probe视图,查看LIPC拓扑。回显信息中的第一列“LIP”数值对应所有当前在位板卡的LIPC拓扑索引号,在下图示例中即对应“4145”“4144”、“2097”直至“2136”

2、根据前述命令,逐个检查全部LIP编号LIPC统计数据,重点检查红框内三种错包统计值是否非0。在下图示例中,对LIP编号为“4145”通道的检查结果显示没有发现错包统计。在现场排查中,工程师需要重复操作,对所有LIP编号的LIPC通道执行检查。

3、若某个LIP编号的LIPC通道统计值中,出现上述红框内任意一种错包统计值为非0,则说明现场M9000设备已经出现本公告所描述问题隐患。

  1. 请办事处立即对全网M9000设备依据本公告提供的方法进行检查,对发现问题遗患的设备应当立即安排版本升级操作,将主控板及防火墙业务单板至CMW710-R9115P18版本

  2. 现场M9000设备安装有NSQ1CGC2SE0接口单板(支持两个100G CFP接口的单板)的局点,需升级至CMW710-R9115P18后加载主控板CMW710-R9115P18H01补丁。

  3. 现场M9000设备暂未出现本公告描述问题,或客户暂时无法安排软件升级的局点,需密切关注设备LIPC通道运行状态,记录局点信息并制定软件升级计划。

  4. 现场M9000设备已经出现本公告所述问题且造成部分软件进程挂死的,可通过整机重启临时恢复。