Print

关于CAS配合CNA融合网卡FCoE特性使用时产生链路间歇性中断问题的公告

2015-01-15 发表

关于CAS配合CNA融合网卡FCoE特性使用时产生链路间歇性中断问题的公告

【产品型号】

NIC-10GE-2P-CNA,机架服务器2端口10GE CNA网卡(FCoE扩展网卡)

NIC-FlexFabric-10GE-2P,刀片服务器FlexFabric 2*10GE 网卡;

VCM-Flex10-26PFlex-10 26端口刀片系统的VC模块;

VCM-FlexFabric-10GE-24PFlexFabric 10 24端口刀片系统的VC模块;

主要涉及使用我司NIC-10GE-2P-CNA 网卡的H3C FlexServer机架服务器与某些友商的FCoE交换机配合的场景,使用我司NIC-FlexFabric-10GE-2P网卡的H3C FlexServer刀片服务器与VC模块配合的场景。

可能涉及某些友商的FCoE交换机产品。

【涉及版本】

H3C CAS2.0 E0209以前版本(包含E0202E0202H03E0202H05不涉及CAS 1.0版本)

【问题描述】

CANConverged Network Adapter)融合网卡支持FCoE特性,当此特性与CAS特定版本(见【涉及版本】描述)以及VC模块或某些友商的FCoE交换机,三者配合使用时,会造成FCoE链路间歇性中断,从而影响使用此链路的CAS功能,产生如共享存储性能慢、共享存储池心跳超时、ocfs2 fence等问题,此类问题常发生于向存储池内写入较大文件时。

【原因分析】

CNA融合网卡工作在以太网模式会使用Normal MAC1工作在FCoE模式时会使用CEEConverged Enhanced EthernetMAC2H3C CAS2.0等版本为配合iMC网管平台网络拓扑展示功能,缺省启动了LLDP服务,该服务定期发送LLDP报文,使用CNA融合网卡上报给CVK系统的以太网模式下的MAC1。同时,CNA融合网卡硬件也定期发送LLDP报文(由网卡自动发出,不受CAS控制),此LLDP报文使用的是FCoE模式下的CEE MAC2。二者的MAC地址不同,相应服务器网卡外接FCoE设备(如VC网络模块、某些友商FCoE交换机)接口在收到这两个不同MAC LLDP报文时会处理异常,从而导致连接存储的FCoE链路拥塞或者中断,从而影响到相关的CAS存储性能、导致存储连接超时,甚至ocfs2 fence

【规避措施/解决方案】

升级CAS版本至E0209(或更高版本)可解决此问题,从E0209版本起默认关闭LLDP服务。

临时规避方法:

1.登录CVK后台,使用service lldpad stop命令停止LLDP服务:

root@CVK:~# service lldpad stop

2.修改自启动配置,取消LLDP服务随主机自动启动,修改方法如下:

root@CVK:~# cd /etc/rc2.d/

root@CVK:/etc/rc2.d# rm S25lldpad