知

M9000流量不大CPU利用率低的情况下出现丢包现象

2016-04-27 发表

0关注
1收藏 1938浏览

王晗

王晗九段

粉丝：24人关注：0人

某客户购买我司两台M9006，割接后出现oracle数据库每天早上10：00左右和下午15：00左右断开一次连接的情况，断开后因为软件机制又重新连接。了解到客户的数据库业务十分依赖长连接，初步判断为中间出现丢包现象，导致连接断裂。

查看当时的流量和CPU利用率均不高，配置没有任何问题，现象比较奇怪

M9000设备没有出现告警，客户的服务器出现连接断开的告警，并自行重新建立连接后恢复

查看诊断信息发现：

353 4 0K 100 D 6:53:12:470 [kdrvdp4]
354 5 0K 100 D 6:40:23:340 [kdrvdp5]
355 6 0K 100 D 7:4:3:680   [kdrvdp6]
356 7 0K 100 D 7:14:4:200 [kdrvdp7]
357 8 0K 100 D 6:48:56:850 [kdrvdp8]
358 9 0K 100 D 6:53:31:540 [kdrvdp9]
359 10   0K 100 D 6:49:31:930 [kdrvdp10]
360 11    0K 100 D 7:36:2:560 [kdrvdp11]
361 12   0K 100 D 6:50:12:850 [kdrvdp12]
362 13    0K 100 D 7:35:0:400 [kdrvdp13]
363 14    0K 100 D 7:22:32:420 [kdrvdp14]
364 15    0K 100 D 7:36:36:160 [kdrvdp15]
365 16    0K 100 D 7:4:32:720 [kdrvdp16]
366 17    0K 100 D 13:37:34:980   [kdrvdp17]
367 18    0K 100 D 7:4:17:860 [kdrvdp18]
368 19    0K 100 D 7:55:34:940 [kdrvdp19]
369 20    0K 100 D 7:15:51:800 [kdrvdp20]
370 21    0K 100 D 6:51:49:700 [kdrvdp21]
371 22    0K 100 D 7:21:57:510 [kdrvdp22]
372 23    0K 100 D 6:58:42:500 [kdrvdp23]
373 24    0K 100 D 7:58:38:660 [kdrvdp24]
374 25    0K 100 D 6:55:10:290 [kdrvdp25]
375 26    0K 100 D 6:48:45:960 [kdrvdp26]
376 27    0K 100 D 6:49:21:620 [kdrvdp27]
377 28    0K 100 D 7:2:34:960 [kdrvdp28]
378 29    0K 100 D 6:58:9:190 [kdrvdp29]
379 30    0K 100 D 6:50:29:600 [kdrvdp30]
380 31    0K 100 D 7:19:48:60 [kdrvdp31]

vCPU17的CPU占用时间是其他vCPU的两倍左右，初步判断发生了单个转发核跑满的情况，收集高峰期时的诊断发现vCPU17的CPU利用率已经到了3.7%

366 366 3.7 0.0 R 100 - 09:09:06 [kdrvdp17]

数值看起来不大，但是32个vCPU平分100%的CPU，平均下来每个vCPU能得到3.125%的CPU利用率，高峰期时vCPU17已经严重超荷运行，抢占了其他的资源。经过实验室模拟测试，在vCPU超过3.3%的情况下，丢包开始显现。

原因分析：M9000等V7防火墙默认的流分类为逐流模式，报文会按照5元组HASH到各个vCPU上处理，这样的HASH算法不能保证流量绝对平均，如果客户业务集中在几个流上，或者报文经过HASH后正好集中于一个转发核。转发核在繁忙的情况下，会随机丢弃报文。如果客户业务对丢包时序特别敏感，就会影响到业务

修改M9000流分类策略为逐包模式

进入系统视图
system-view
配置流分类策略
forwarding policy { per-flow | per-packet }
缺省情况下，采用基于流处理的流分类策略

请注意，这样报文可能会引来乱序，现场业务需要做好评估

在网管上查看CPU利用率低，并不能反馈设备的真实情况。只能反映设备整体的数值，在遇到故障时，还需要从诊断中分析，3.7%也是很小的数值，但是明白其中的计算方法就可以知道问题的根因

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

作者在2019-06-12对此案例进行了修订

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 知了APP下载; 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

M9000流量不大CPU利用率低的情况下出现丢包现象

编辑评论

提出建议