socket,检测连接丢失

时间:2010-12-03 12:16:35

标签: c++ c sockets

我正在使用TCP连接连接服务器进程和客户端进程,我必须检测到 两台机器之间的物理连接断开了。我正在尝试使用keepalive执行此操作 将默认的系统范围值减小到:

TCP_KEEPIDLE = 5
TCP_KEEPCNT = 5
TCP_KEEPINTVL = 1

当连接断开时(我断开电缆),只有服务器在10秒内检测到连接已丢失,客户端只是挂起发送。

这是客户端代码:

#include <iostream>
#include <string.h>
#include <sys/socket.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <errno.h>
#include <netinet/tcp.h>

int main(int argc, char** argv) {
  char myVector[1600];

  int mySocket = socket(AF_INET, SOCK_STREAM, IPPROTO_IP);
  if (mySocket < 0 ) {
    std::cout << "error creating the socket" << strerror(errno) << std::endl;
    ::exit(-1);
 }

 struct sockaddr_in sin;
 memset( (char *)&sin, 0, sizeof( sin ) );
 sin.sin_addr.s_addr = inet_addr("192.168.21.27");
 sin.sin_port   = htons(7788);
 sin.sin_family = AF_INET;

 if ( connect( mySocket, (struct sockaddr *)&sin, sizeof( sin )) < 0 ) {
   std::cout << "Error on connection: " << strerror(errno) << std::endl;
   ::exit(-1);
 }

 int optval = 1;
 socklen_t optlen = sizeof(optval);

 /*Enabling keep alive*/
 if(setsockopt(mySocket, SOL_SOCKET, SO_KEEPALIVE, &optval, optlen) < 0) {
   std::cout << "Error setting SO_KEEPALIVE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPIDLE, &optval, optlen) < 0) {
    std::cout << "Error setting TCP_KEEPIDLE: " << strerror(errno) << std::endl;
 }

 optval = 5;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPCNT, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPCNT: " << strerror(errno) << std::endl;
 }

 optval = 1;
 optlen = sizeof(optval);
 if(setsockopt(mySocket, SOL_TCP, TCP_KEEPINTVL, &optval, optlen) < 0) {
   std::cout << "Error setting TCP_KEEPINTVL: " << strerror(errno) << std::endl;
 }

 for (;;) {
   ssize_t myRet= ::send(mySocket,
                                      myVector,
                                      sizeof(myVector),
                                     0);
   if (myRet < 0) {
     std::cout << "Error: " << strerror(errno) << std::endl;
     break;
   }
   std::cout << myRet << "."; std::cout.flush();
   sleep(1);
 }
}

我确定我错过了什么,但是什么?

5 个答案:

答案 0 :(得分:8)

TCP Keepalive不适用于此用途。

如果要检测应用程序层的中断,请执行SSH,IMAP和IRC等协议 - 在应用程序层实现echo / ping类型的消息。定期发送,如果没有及时回复,可以认为连接已断开。

答案 1 :(得分:3)

我们不久前在我们公司想到了这个问题:“如何检测到这种连接失败了?”。 为了可靠地解决这个问题,我们必须实现一个“心跳”系统,即客户端通过执行伪ping来定期检查(在我们的情况下每秒)服务器仍在那里。 如果您不想这样做,您可以等待操作系统实际检测到连接断开,但不要指望它是可靠的......

答案 2 :(得分:3)

所以, 在进一步调查之后,即使“TCP Keepalive”不是用于此用途,我发现保持活动探测器开始在“空闲连接”上发送。现在的问题是:“当连接被认为处于空闲状态时?”。 当没有数据“正在传输”时,连接被视为空闲,因此如果其中一个连接 发送时阻塞了两个对等体(...)实际上有一些数据正在传输,并且连接不被视为空闲。我想我现在唯一的选择是使用带有超时的send / recv进行ping / pong,当这些计时器到期时声明连接“丢失”。

答案 3 :(得分:0)

Gaetano,IMO,TCP keep-alives可用于检测死连接。在您的示例中,客户端可能实际上挂在发送中等待TCP重试耗尽自己。根据退避算法和TCP堆栈状态机,这可以持续几分钟而没有任何保持活动的探测器,因此无法耗尽keepcnt。

我认为服务器主要是读取阻塞的,在这种情况下,它的保持活动将在每个keepidle / slowhz秒发出(slowhz通常是2而不是1),它会很快检测到连接丢失

如果使用tcpdump捕获数据包跟踪,您将确切地看到线路上发生了什么。

答案 4 :(得分:0)

您应该将SOL_TCP替换为IPPROTO_TCP
有关更多信息,请访问以下链接