• 全部
  • 经验案例
  • 典型配置
  • 技术公告
  • FAQ
  • 漏洞说明
  • 全部
  • 全部
  • 大数据引擎
  • 知了引擎
产品线
搜索
取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式
高级搜索

S5800上开启流控,因下联服务器故障导致网络不通问题

  • 0关注
  • 0收藏 1611浏览
粉丝:3人 关注:0人

某云计算中心核心为两台S10512IRF2,接存储资源的汇聚交换机S5800通过两条万兆链路做链路聚合和S10512连接。当前发现下挂存储资源不定时无法被其他设备访问。现场查看,故障发生时S5800TEN1/0/2接口下挂的服务器Server2死机,从S5800 PING S10512、从S5800 PING 下挂的部分服务器及存储,无法PING通,将TEN1/0/2的端口SHUT DOWN,所有业务恢复正常。后用户将该死机设备重启后,业务恢复正常。


收集故障发生后的诊断信息。

interface Ten-GigabitEthernet1/0/2

 port link-mode bridge

 port access vlan 3880

 speed 10000

 duplex full

 flow-control

 

Ten-GigabitEthernet1/0/2 current state: UP

 IP Packet Frame Type: PKTFMT_ETHNT_2, Hardware Address: 7425-8ad8-7484

 Description: Ten-GigabitEthernet1/0/2 Interface

 Loopback is not set

 Media type is optical fiber,Port hardware type is 10G_BASE_SR_SFP

 10Gbps-speed mode, full-duplex mode

 Link speed type is force link, link duplex type is force link

 Flow-control is enabled

 The Maximum Frame Length is 10000

 Broadcast MAX-ratio: 100%

 Unicast MAX-ratio: 100%

 Multicast MAX-ratio: 100%

 Allow jumbo frame to pass

 PVID: 3880

 Link delay is 0(sec)

 Port link-type: access

  Tagged   VLAN ID : none

  Untagged VLAN ID : 3880

 Port priority: 0

 Peak value of input: 11798276 bytes/sec, at 2000-04-26 12:08:37

 Peak value of output: 12628909 bytes/sec, at 2000-04-28 00:25:07

 Last 300 seconds input:  483 packets/sec 476244 bytes/sec 0%

 Last 300 seconds output:  383 packets/sec 364907 bytes/sec 0%

 Input (total):  448824528 packets, 452985151230 bytes

    446929080 unicasts, 244 broadcasts, 34 multicasts, 1895170 pauses

 Input (normal):  446929358 packets, - bytes

    446929080 unicasts, 244 broadcasts, 34 multicasts, 1895170 pauses

 Input:  0 input errors, 0 runts, 0 giants, 0 throttles

    0 CRC, 0 frame, - overruns, 0 aborts

    - ignored, - parity errors

 Output (total): 552361011 packets, 672669008394 bytes

    552072494 unicasts, 63534 broadcasts, 19706 multicasts, 205277 pauses

 Output (normal): 552155734 packets, - bytes

552072494 unicasts, 63534 broadcasts, 19706 multicasts, 205277 pauses

 Output: 0 output errors, - underruns, - buffer failures

    0 aborts, 0 deferred, 0 collisions, 0 late collisions

    0 lost carrier, - no carrier

发现当前端口下都开启了flow control配置,所有端口出方向均有pauses帧。除了上联S105的接口,其余端口入方向都有少量pause帧,1/0/2口入方向pause帧尤为多。怀疑现场的现象与流控有关。

配置flow-control命令后,当本端发生拥塞时,设备会向对端发送流量控制报文,告知对端本端已产生拥塞,不要再向本端发送报文;当本端收到对端的流量控制报文后,会停止报文发送。具体说来,端口收到pause帧之后,这个端口短时间内停止向对端发送报文,这个时间参数携带在pause报文中。端口若连续收到多个pause帧势必导致缓冲区积压报文;进一步讲,如果有其他端口正往这个端口转发报文,那么这些端口入方向就会积压报文,报文积压至一定数量会触发端口向外发送PAUSE帧。对端设备收到pause帧后将停止向该端口发送报文,从而导致所有经过这些链路的流量都会中断。

因此推测该问题是TEN1/0/2下挂设备异常,持续发送pause帧所致。可通过如下步骤确认:

1、在网络正常时查看1/0/2口入方向pause帧的增长,和其他端口出方向pause帧增长情况

2、在问题复现时查看1/0/2口入方向pause帧的增长,和其他端口出方向pause帧增长情况,与正常情况对比;

3、在问题复现时关闭S5800上的流控,测试网络的连通性。

现常反馈进一步测试信息如下:

1、在服务器死机之前,查看各端口的PAUSE帧情况,TEN1/0/2端口的INOUT方向基本没有PAUSE帧,其它部分端口有,基本是在OUT方向,增长速度较慢,不定时增长;

2、服务器死机后,先清除接口计数,再查看PAUSE帧情况,在TEN1/0/2端口的IN方向有PAUSE帧,增长速度较快且匀速,其它端口的OUT方向有PAUSE帧,增长速度较快且匀速;在S5800上无法已PING通交换机下挂的部分服务器及上连的S10512

3、将TEN1/0/2接口下的flow-control关闭,在S5800上能PING通交换机下挂的所有服务器及上连的S10512,将TEN1/0/2接口下的flow-control开启,故障现象重新复现。

至此可判断故障现象由服务器不定时死机,对外发送大量pause帧引起。

流控的应用一般多见于存储网络,流控一定程度上能够缓减网络拥塞,提高链路带宽的利用率。正常情况下也很少会遇到流控导致网络中多台设备不通的问题,因为pause携带的时间参数很短,网络流量也不会持续突发。像本例中服务器异常死机不断发送pause帧现象比较少见。根据这个案例可以提供一个排查网络不通的另一个排查点,若网络不通,接口下又有大量pause帧时,可根据流控原理,网络的互访关系排查下流控导致不通的可能性。

1、在交换机上关闭流控;

2、或者服务器侧能有机制避免设备出现异常,如检测异常立即重启;

3、建议不要上行口上开启流控,避免单台服务器异常,上行流量全部中断。

该案例对您是否有帮助:

您的评价:1

若您有关于案例的建议,请反馈:

作者在2019-06-11对此案例进行了修订
0 个评论

该案例暂时没有网友评论

编辑评论

举报

×

侵犯我的权益 >
对根叔知了社区有害的内容 >
辱骂、歧视、挑衅等(不友善)

侵犯我的权益

×

泄露了我的隐私 >
侵犯了我企业的权益 >
抄袭了我的内容 >
诽谤我 >
辱骂、歧视、挑衅等(不友善)
骚扰我

泄露了我的隐私

×

您好,当您发现根叔知了上有泄漏您隐私的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您认为哪些内容泄露了您的隐私?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)

侵犯了我企业的权益

×

您好,当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱,我们会在审核后尽快给您答复。
  • 1. 您举报的内容是什么?(请在邮件中列出您举报的内容和链接地址)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
  • 3. 是哪家企业?(营业执照,单位登记证明等证件)
  • 4. 您与该企业的关系是?(您是企业法人或被授权人,需提供企业委托授权书)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

×

原文链接或出处

诽谤我

×

您好,当您发现根叔知了上有诽谤您的内容时,您可以向根叔知了进行举报。 请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱,我们会尽快处理。
  • 1. 您举报的内容以及侵犯了您什么权益?(请在邮件中列出您举报的内容、链接地址,并给出简短的说明)
  • 2. 您是谁?(身份证明材料,可以是身份证或护照等证件)
我们认为知名企业应该坦然接受公众讨论,对于答案中不准确的部分,我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

×

垃圾广告信息
色情、暴力、血腥等违反法律法规的内容
政治敏感
不规范转载 >
辱骂、歧视、挑衅等(不友善)
骚扰我
诱导投票

不规范转载

×

举报说明

提出建议

    +

亲~登录后才可以操作哦!

确定

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

你的邮箱还未认证,请认证邮箱或绑定手机后进行当前操作