来自不同虚拟IP的1024个连接后超时

时间:2015-05-18 09:01:29

标签: python linux sockets tcp network-programming

我有一个问题,我现在一直在努力解决它。

我正在实现一个具有客户端和服务器端的流量生成器。客户端模拟具有唯一IP地址的设备。这些IP作为虚拟接口添加到客户端,然后模拟设备将绑定到该客户端。然后,设备将连接到服务器端并生成往返服务器的流量。

问题是我只能连接1023设备,然后以下设备会在连接上超时。我已经检查了服务器端的wireshark,我可以看到连接的SYN,但它从未在应用程序中收到。当我重复使用IP以便使用少于2014时,我可以根据需要创建尽可能多的连接。

我创建了一个更容易运行的python程序并遇到了同样的问题:

client.py

import socket
import thread
import time
from subprocess import call

TCP_IP = '192.168.169.218'
TCP_PORT = 9999
BUFFER_SIZE = 1024
MESSAGE = "-" * 1000

if __name__=='__main__':
    sockets = []
    for i in range(0, 10020):
        ip = "13.1."+ str(((i/254)%254) + 1) + "." + str((i % 254) + 1)
        cmd = "ip addr add " + ip + " dev eth1;"
        call(cmd, shell=True)
        s = socket.create_connection((TCP_IP, TCP_PORT), 10, (ip, 0))
        sockets.append(s)

    while 1:
        for s in sockets:
            s.send(MESSAGE)
            data = s.recv(BUFFER_SIZE)

    for s in sockets:
        s.close()

server.py

from socket import *
import thread

BUFF = 1024
HOST = '192.168.169.218'
PORT = 9999

def handler(clientsock,addr):
    while 1:
        data = clientsock.recv(BUFF)
        if not data: break
        clientsock.send(data)
        # type 'close' on client console to close connection from the server side
        if "close" == data.rstrip(): break     
    clientsock.close()
    print addr, "- closed connection" #log on console

if __name__=='__main__':
    count = 0   
    ADDR = (HOST, PORT)
    serversock = socket(AF_INET, SOCK_STREAM)
    serversock.setsockopt(SOL_SOCKET, SO_REUSEADDR, 1)
    serversock.bind(ADDR)
    serversock.listen(5)
    while 1:
        print 'waiting for connection... listening on port', PORT
        clientsock, addr = serversock.accept()
        count += 1
        print count
        thread.start_new_thread(handler, (clientsock, addr))

我正在运行CentOS 7.1 64位,而我测试过的Python版本是2.7.5。

到目前为止我做了什么:
  - 将打开文件数量限制(nofile)增加到1040000
  - net.core.somaxconn增加到65535
  - 将net.ipv4.tcp_max_syn_backlog和net.core.netdev_max_backlog增加到30000
  - 增加核心和TCP缓冲区
  - 禁用防火墙并清除所有iptables规则

我测试过让python客户端在每次连接后睡一秒钟,然后没有问题,所以我的猜测是有一些防洪启动或什么的。有任何想法的人吗?

1 个答案:

答案 0 :(得分:1)

有趣的问题,所以我用我的VM进行了测试。我能够发现,你正在限制ARP邻居条目

# sysctl -a|grep net.ipv4.neigh.default.gc_thresh
net.ipv4.neigh.default.gc_thresh1 = 128
net.ipv4.neigh.default.gc_thresh2 = 512
net.ipv4.neigh.default.gc_thresh3 = 1024

以上是默认值,当您的第1024个连接填满此表时,垃圾收集器再次开始运行arp - 这会减慢并导致客户端超时

我能够将这些值设置如下

net.ipv4.neigh.default.gc_thresh1 = 16384
net.ipv4.neigh.default.gc_thresh2 = 32768
net.ipv4.neigh.default.gc_thresh3 = 65536

瞧!!没有1024限制..HTH