知

负载均衡压测过程中的端口复用问题案例分享

2023-08-30 发表

0关注
3收藏 1231浏览

孔凡安

孔凡安九段

粉丝：38人关注：3人

组网及说明

组网简易化模型如下：

压测系统---LB---Nginx服务器

备注：LB设备（做了SNAT）基于四层负载，将前端的HTTP请求根据负载算法均匀分担到后端的多个Nginx服务器上。压测系统发起新建连接请求，收到HTTP响应即认为交易成功。

告警信息

不涉及

问题描述

压测系统新建连接较小（新建500）的情况下，交易成功率稳定在100%。但是新建连接速率提升以后，随着时间的推移交易成功率急速下降，最终成功率60%左右。

该场景为压测场景，模拟客户系统上线遭遇突发流量。因此问题亟需解决。

过程分析

首先还是分析压测过程中设备的性能参数（CPU、内存、接口利用率等），发现均没有超过设备性能。设备作用主要是四层负载，基于数据流（网络层和传输层信息）进行负载分担，性能压力不是很大。

那么这个时候能做的就是抓个包来看下了，抓包位置位于LB设备（ip.addr==172.34.84.72）和后端Nginx服务器之间。通过抓包发现：

1. LB转发给Nginx的TCP请求，发起了SYN请求，Nginx也返回了ACK。
2. SYN和ACK的Seq无法匹配，认为连接失败。等待3秒后再次发起请求，再次收到错误回应。再等待2秒后发起RST，认为连接失败。

那么为什么会出现这种情况呢？根据报文推测后端Nginx服务器上还存在原先的连接，并没有老化。LB上发起的新的连接无法与之匹配，导致两端交互异常。如下报文可以证实这一点，通过五元组以及Seq以及Ack等参数可以进一步明确Nginx上还存在原来的连接。

下面进行TCP/IP协议关于四次挥手过程的科普环节，下图为TCP拆链过程中状态机的跳转过程，主动断开连接的一方接收到最后一个ACK确认报文后要等待2 MSL时间才能关闭连接。RFC 793 中有指出 TCP 连接需要在 TIME_WAIT 中等待 2 倍的 MSL，RFC 793 文档将 MSL 的时间设置为 120 秒，即两分钟，然而这并不是一个经过严密推断的数值；实际上，Linux 开始就将 TIME_WAIT 的等待时间 TCP_TIMEWAIT_LEN 设置成 60 秒，以便更快地复用 TCP 连接资源。

简单进行一个算数题，在 Linux 上，客户端的可以使用端口号 32,768 ~ 61,000，总共 28,232 个端口号与远程服务器建立连接，应用程序可以在将近 3 万的端口号中任意选择一个，但是如果主机在过去一分钟时间内与目标主机的特定端口创建的 TCP 连接数超过 28,232，那么再创建新的 TCP 连接就会发生错误，也就是说如果我们不调整主机的配置，那么每秒能够建立的最大 TCP 连接数约为470（28232\60）。

那么基于以上分析，似乎优化Nginx服务器的2 MSL时间是一个最优解。有没有一种可能在lB设备上做文章呢？

答案是可以，基于前面的分析我们可以得知，新建的连接对于LB设备来说是新廉洁，因为会话处于tcp-time-wait以及tcp-close状态时老化时间只有2S。那么网络设备去配合应用侧，在LB设备上把老化时间调大，Time-Wait时间比后端服务器更长，不会出现连接复用，则不会出现Seq出错，成功率得到维持。

以上的参数调整可以完美的解决连接复用的问题，然后事情都是一环扣一环环环相扣。老化时间调整后由此衍生出一个新的问题，那就是SNAT端口又不够用了。想象一下设备上有十几万会话维持在TCP-CLOSE或者TCP-TIME-WAIT状态，会导致LB设备端口不足，这会直接导致业务异常。

这个问题解决起来要简单多了，直接SNAT地址池加地址即可。

解决方法

LB设备调整老化时间长于后端Nginx服务器2 MSL时间+LB设备增加地址池地址组合拳。

该案例对您是否有帮助：

您的评价：1

若您有关于案例的建议，请反馈：

0 个评论

该案例暂时没有网友评论

编辑评论

侵犯我的权益 >

对根叔知了社区有害的内容 >

辱骂、歧视、挑衅等（不友善）

侵犯我的权益

泄露了我的隐私 >

侵犯了我企业的权益 >

抄袭了我的内容 >

诽谤我 >

辱骂、歧视、挑衅等（不友善）

骚扰我

泄露了我的隐私

您好，当您发现根叔知了上有泄漏您隐私的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您认为哪些内容泄露了您的隐私？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

侵犯了我企业的权益

您好，当您发现根叔知了上有关于您企业的造谣与诽谤、商业侵权等内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到 pub.zhiliao@h3c.com 邮箱，我们会在审核后尽快给您答复。

1. 您举报的内容是什么？（请在邮件中列出您举报的内容和链接地址）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）
3. 是哪家企业？（营业执照，单位登记证明等证件）
4. 您与该企业的关系是？（您是企业法人或被授权人，需提供企业委托授权书）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

抄袭了我的内容

原文链接或出处

诽谤我

您好，当您发现根叔知了上有诽谤您的内容时，您可以向根叔知了进行举报。请您把以下内容通过邮件发送到pub.zhiliao@h3c.com 邮箱，我们会尽快处理。

1. 您举报的内容以及侵犯了您什么权益？（请在邮件中列出您举报的内容、链接地址，并给出简短的说明）
2. 您是谁？（身份证明材料，可以是身份证或护照等证件）

我们认为知名企业应该坦然接受公众讨论，对于答案中不准确的部分，我们欢迎您以正式或非正式身份在根叔知了上进行澄清。

对根叔知了社区有害的内容

垃圾广告信息

色情、暴力、血腥等违反法律法规的内容

政治敏感

不规范转载 >

辱骂、歧视、挑衅等（不友善）

骚扰我

诱导投票

不规范转载

举报说明

✖

案例意见反馈

➤

网站相关: 关于我们; 服务条款; 帮助中心; 经验与权限; 积分规则

联系我们: 联系我们; 建议反馈

常用链接: 标杆的神器下载

关注我们: H3C官网; 新华三服务公众号; 安仔远程运维服务; 新华三商城

内容许可: 除特别说明外，用户内容均可采用知识共享署名-相同方式共享3.0中国大陆许可协议进行许可

本图标版权归新华三集团所有，仅限本社区使用，切勿用做商业目的，违者必究

浙ICP备09064986号-1 浙公网安备 33010802004416号

✖

亲~登录后才可以操作哦!

确定

✖

亲~检测到您登陆的账号未在http://hclhub.h3c.com进行注册

注册后可访问此模块

跳转hclhub

✖

你的邮箱还未认证，请认证邮箱或绑定手机后进行当前操作

✖

产品线		搜索取消
案例类型
发布者
是否解决
是否官方
时间
搜索引擎
匹配模式	默认策略匹配全词匹配整句

负载均衡压测过程中的端口复用问题案例分享

组网及说明

告警信息

问题描述

过程分析

解决方法

编辑评论

提出建议