SO_RCVTIMEO太早醒来

时间:2016-03-01 22:21:53

标签: linux sockets timeout posix darwin

SO_RCVTIMEO的Linux manpage说:

  

指定接收或发送超时,直到报告错误...如果输入或输出功能在这段时间内阻塞... [和]没有传输数据并且已达到超时,则-1为返回时将errno设置为EAGAIN或EWOULDBLOCK,或EINPROGRESS(用于连接(2))

这听起来像I / O应该等待至少 SO_RCVTIMEO,然后再将执行返回给调用者。与此同时,at the Open Group,他们记录了相反的情况:

  

设置超时值,指定输入函数在完成之前等待的最大时间。

那么它是最小阻塞时间还是最大阻塞时间?答案似乎是:是的。当我在Linux系统上要求.500s超时时会发生以下情况:

time: 0.497054 result: 0
time: 0.495352 result: 0
time: 0.504948 result: 0
time: 0.495119 result: 0
time: 0.507884 result: 0
time: 0.491892 result: 0
time: 0.500764 result: 0

我们看到时间是错误的,通常是大约7ms左右,这是一个很长的时间错误。错误发生在两个方向。同时在达尔文:

time: 0.500426 result: -1
time: 0.501144 result: -1
time: 0.500507 result: -1
time: 0.501119 result: -1
time: 0.501016 result: -1
time: 0.500540 result: -1
time: 0.500127 result: -1
time: 0.500815 result: -1
time: 0.500341 result: -1
time: 0.500871 result: -1
time: 0.500835 result: -1
time: 0.501138 result: -1
time: 0.501087 result: -1
time: 0.501153 result: -1
time: 0.501149 result: -1

错误要低得多(约1ms),但仍然存在,并且它们清楚地将500ms解释为最小时间,而不是最大值。

现在有些问题:

  • SO_RCVTIMEO应该是阻止呼叫者的最小或最长持续时间吗?
  • 如果是最长持续时间,最低限度是多少?当被要求500毫秒超时时,一个实现是不是可以自由选择非阻塞读取?
  • 如果是最短的持续时间,Darwin是错的吗?
  • 如果我想保证我尝试读取至少 500ms,我是否应该继续尝试循环直到500ms?实现“至少X ms”行为的“正确方法”是什么?
  • 为什么Linux上的呼叫到呼叫有这么大的差异?错误的来源是什么?
  • 我应该使用更好的API来读取套接字吗?

我用来衡量这个代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <time.h>
#include <fcntl.h>

#ifdef __MACH__
#include <mach/clock.h>
#include <mach/mach.h>
#endif
void error(const char *msg)
{
    perror(msg);
    exit(1);
}

struct timespec os_time() {
    struct timespec ts;
    #ifdef __MACH__ // OS X does not have clock_gettime, use clock_get_time
    clock_serv_t cclock;
    mach_timespec_t mts;
    host_get_clock_service(mach_host_self(), CALENDAR_CLOCK, &cclock);
    clock_get_time(cclock, &mts);
    mach_port_deallocate(mach_task_self(), cclock);
    ts.tv_sec = mts.tv_sec;
    ts.tv_nsec = mts.tv_nsec;

    #else
    clock_gettime(CLOCK_REALTIME, &ts);
    #endif
    return ts;
}

int main(int argc, char *argv[])
{
     int sockfd, newsockfd, portno;
     socklen_t clilen;
     char buffer[256];
     struct sockaddr_in serv_addr, cli_addr;
     int n;
     if (argc < 2) {
         fprintf(stderr,"ERROR, no port provided\n");
         exit(1);
     }
     sockfd = socket(AF_INET, SOCK_STREAM, 0);
     if (sockfd < 0)
        error("ERROR opening socket");
     bzero((char *) &serv_addr, sizeof(serv_addr));
     portno = atoi(argv[1]);
     serv_addr.sin_family = AF_INET;
     serv_addr.sin_addr.s_addr = INADDR_ANY;
     serv_addr.sin_port = htons(portno);
     if (bind(sockfd, (struct sockaddr *) &serv_addr,
              sizeof(serv_addr)) < 0)
              error("ERROR on binding");
     listen(sockfd,5);
     clilen = sizeof(cli_addr);
     newsockfd = accept(sockfd,
                 (struct sockaddr *) &cli_addr,
                 &clilen);
     if (newsockfd < 0)
          error("ERROR on accept");
     for (int i = 0; i < 100; i++) {
         struct timeval tv;

         tv.tv_sec = 0;
         tv.tv_usec = 500000;
         char buf[1];
         if (setsockopt(newsockfd, SOL_SOCKET, SO_RCVTIMEO, (char *)&tv,sizeof(struct timeval)) != 0){
             error("setsockopt error");
         }
         struct timespec start = os_time();
         int result = recv(newsockfd,buf,1,0);
         struct timespec end = os_time();

         double end_time = (double)end.tv_sec + ((double)end.tv_nsec)/1.0E9;
         double start_time = (double)start.tv_sec + ((double)start.tv_nsec)/1.0E9;
         printf("time: %f result: %d\n",end_time-start_time, result);
     }
     return 0;
}

繁殖:

clang test.c && ./a.out 5551 &
telnet localhost 5551
time: 0.497839 result: 0
time: 0.501052 result: 0
time: 0.498565 result: 0
time: 0.500741 result: 0
time: 0.500108 result: 0
time: 0.500244 result: 0
time: 0.499040 result: 0
time: 0.500212 result: 0
time: 0.500137 result: 0
time: 0.499920 result: 0
time: 0.500758 result: 0
time: 0.498068 result: 0

1 个答案:

答案 0 :(得分:4)

  

这听起来像I / O应该至少等待SO_RCVTIMEO才能将执行返回给调用者。

没有。它应该等待最多超时。如果数据已经存在,或者在超时之前到达,则该方法在该点返回,而不等待超时到期。

  

与此同时,在Open Group,他们记录了相反的情况:

     
    

设置超时值,该值指定输入函数在完成之前等待的最长时间。

  
     

那么它是最小阻塞时间还是最大阻塞时间?

最长阻止时间。

  

他们清楚地将500毫秒解释为最短时间,而不是最大时间。

在这里,您要问和测试两个不同的问题:计时器的分辨率以及操作系统在超时后重新安排线程的速度。两者都没有具体说明。

  

SO_RCVTIMEO应该是阻止呼叫者的最小或最长持续时间吗?

最大值,在其(即操作系统的)分辨率范围内,并且可能会有进一步的调度延迟。

  

如果它是最长持续时间,那么最小值是多少?

零。

  

当被要求500毫秒超时时,一个实现是不是可以自由选择非阻塞读取?

当然是。如果套接字接收缓冲区中已存在数据,recv()将传输该数据并立即返回。为什么要等?

  

如果它是最短持续时间,那么达尔文错了吗?

不,它只有不同的分辨率和重新安排延迟。

  

如果我想保证我尝试读取至少500毫秒,我是否应该继续尝试循环直到500毫秒?什么是正确的方式&#34;实施&#34;至少X ms&#34;行为?

你必须用你自己的计时器这样做,但我看不出重点。如果数据已经存在,或者早些时候到达,那么为什么要延迟呢?

  

为什么Linux上的呼叫到呼叫有这么大的差异?错误的来源是什么?

定时器抖动;重新安排抖动。它不是一个实时操作系统

  

我应该使用更好的API来读取套接字吗?

定义更好的&#39;。你的期望似乎很奇怪。 30多年来,这个API已经足够其他所有人了。