Print

Oneview3.1管理的刀片机箱出现断网,所有网络无法连通

2017-10-29 发表

用户新刀片系统使用的oneview3.1管理,所有刀片服务器使用SPP2017071的版本更新了固件,但是最近频繁出现一个问题,一个或多个刀片机箱出现断网,过一段时间后又自动恢复网络。

出现问题时影响到整个刀片箱的所有刀片服务器的网卡。

登录oneview的界面,可以看到所有的Virtual Connect模块,对外部链接的线路全部都是Standby 模式,而正常刀片机箱的模式是Active + Standby 模式。

如果截图如下


报错提示如下:

Connection on downlink port 4, subport a has failed

所有的VC外部链路状态都变为Standby


VC dump中查看刀片服务器的DDC link不正确,通常是由固件或驱动导致的问题,这个问题可能会影响到整个VC的网络,导致下行链路变为standby


后续经过确认,用户使用的是SPP2017071版本的SPP刷新的固件,这个版本的SPP存在网卡驱动问题

http://kms.h3c.com/View.aspx?id=56163

用户使用之前一个版本的SPP更新后,恢复正常。


当网络出现问题时,除了排查VC及外部网络,也需要查看服务器的网卡固件和驱动是否是支持的版本,或者是否存在的问题的版本。