Question

我的体验：我们有一个连接到rabbitmq服务器的应用服务器。随着时间的推移，从rabbitmq服务器看到的ESTABLISHED连接数量会增加，但来自应用服务器的计数仍然相当稳定。

我在两者上运行：

root@app01:~# netstat -ant | grep EST | grep 5672 | grep 172.25.12.48
tcp        0      0 172.25.12.48:50587      10.48.64.230:5672       ESTABLISHED
tcp        0      0 172.25.12.48:50588      10.48.64.230:5672       ESTABLISHED 

root@rabbit01:~# netstat -ant | grep EST | grep 5672 | grep 172.25.12.48
tcp6       0      0 10.48.64.230:5672       172.25.12.48:38408      ESTABLISHED
tcp6       0      0 10.48.64.230:5672       172.25.12.48:50588      ESTABLISHED
tcp6       0      0 10.48.64.230:5672       172.25.12.48:33491      ESTABLISHED
tcp6       0      0 10.48.64.230:5672       172.25.12.48:50587      ESTABLISHED
tcp6       0      0 10.48.64.230:5672       172.25.12.48:34541      ESTABLISHED

示例结果将在app服务器上给出6，在rabbitmq服务器上给出15（甚至高达46）。我重新启动了rabbitmq服务器，显然一切都恢复正常，每边有2个连接。

我假设交换机超时连接或应用程序不正确地终止进程。我正在研究这个，但我想更好地了解TCP行为。

rabbitmq服务器上的当前设置：

tcp_retries1设为3
tcp_retries2设置为15

所以我通常希望看到那些无效的＆＃39;如果我正确理解论坛，大约13-30分钟后连接就会下降。

然而，看看tcp keepalive值：

tcp_keepalive_time设置为7200（因此在2h后它将发送第一个keepalive探测器。）
tcp_keepalive_intvl是75（所以在第一个之后75秒，它将重新发送探针。）
tcp_keepalive_probes为9（因此它将总共发送9个探测器）

因此，保持活动过程将需要7200+（9 * 75）= 7875，或大约2小时11分钟才能结束。

由于连接（可能）消失，这导致两个问题 1.哪个是正确的？
2.除了可能导致这些无效连接的交换机或应用程序异常终止之外，我是否错过了另一个选项？

来源：https://www.frozentux.net/ipsysctl-tutorial/chunkyhtml/tcpvariables.html

Answer 1

我们的F5就是这个原因。在空闲超时后，F5会从其表中删除该条目。因此，从应用服务器，连接无效，TCP关闭它们。但是，从rabbitmq服务器，不知何故，连接仍然是有效的连接。虽然我不明白为什么交换机能够保持连接状态有效 - 但是，这就是原因。

了解TCP动态

1 个答案: