Linux select()vs ppoll()vs pselect()

时间:2012-03-19 17:32:55

标签: c linux network-programming

在我的应用程序中,有一个专用于

的io-thread
  1. 以自定义协议包装从应用程序接收的数据
  2. 通过tcp / ip
  3. 发送数据+自定义协议数据包
  4. 通过tcp / ip接收数据+自定义协议数据包
  5. 展开自定义协议并将数据交给应用程序。
  6. 应用程序通过不同的线程处理数据。此外,要求规定未确认的窗口大小应为1,即在任何时候应该只有一个待处理的未确认消息。这意味着如果io-thread已经通过套接字发送了一条消息,它将不再发送任何消息,直到它从接收方听到一个确认消息。 应用程序的处理线程通过管道与io-thread通信。如果来自linux CLI的人键入ctrl + C,应用程序需要正常关闭。 因此,鉴于这些要求,我有以下选项

    1. 在套接字和管道描述符上使用PPoll()
    2. 使用选择()
    3. 使用PSelect()
    4. 我有以下问题

      1. select()和poll()之间的决定。我的应用程序只处理少于50个文件描述符。是否可以假设我选择选择或民意调查没有区别?

        1. select()和pselect()之间的决策。我阅读了linux文档,它说明了signal和select之间的竞争条件。我没有信号经验,所以有人可以更清楚地解释竞争条件和选择()吗?它是否与某人在CLI上按ctrl + C并且应用程序没有停止?

        2. 有关
        3. pselect和ppoll()之间的决定?关于一个与另一个的任何想法

4 个答案:

答案 0 :(得分:22)

我建议您开始与select() vs poll()进行比较。 Linux还提供pselect()ppoll(); const sigset_t *pselect()(vs ppoll()select())的额外poll()参数对每个“p变体”具有相同的效果,因为它是。如果您没有使用信号,那么您就没有竞争对手,所以基本问题实际上是关于效率和编程的简易性。

同时这里已经有一个stackoverflow.com回答:what are the differences between poll and select

至于比赛:一旦你开始使用信号(无论出于何种原因),你将了解到一般情况下,信号处理程序应该只设置volatile sig_atomic_t类型的变量来指示信号已被检测到。这样做的根本原因是许多库调用不是re-entrant,并且当你处于“这样的例程”时,可以传递信号。例如,简单地将消息打印到流式数据结构(例如stdout(C)或cout(C ++)可能会导致重新进入问题。

假设您有使用volatile sig_atomic_t flag变量的代码,或许可以捕获SIGINT,类似这样的内容(另请参阅http://pubs.opengroup.org/onlinepubs/007904975/functions/sigaction.html):

volatile sig_atomic_t got_interrupted = 0;
void caught_signal(int unused) {
    got_interrupted = 1;
}
...
    struct sigaction sa;
    sa.sa_handler = caught_signal;
    sigemptyset(&sa.sa_mask);
    sa.sa_flags = SA_RESTART;
    if (sigaction(SIGINT, &sa, NULL) == -1) ... handle error ...
    ...

现在,在代码的主体中,您可能希望“运行直到中断”:

    while (!got_interrupted) {
         ... do some work ...
    }

在你开始需要进行等待某些输入/输出的调用之前,这很好,例如selectpoll。 “等待”操作需要等待I / O-但 还需要等待SIGINT中断。如果你只是写:

    while (!got_interrupted) {
        ... do some work ...
        result = select(...); /* or result = poll(...) */
    }

然后,在您调用select()poll() 之前,可能会发生中断,而不是之后。在这种情况下,您确实被中断 - 并且变量got_interrupted被设置 - 但在此之后,您开始等待。您应该在开始等待之前检查got_interrupted变量,而不是之后。

您可以尝试写作:

    while (!got_interrupted) {
        ... do some work ...
        if (!got_interrupted)
            result = select(...); /* or result = poll(...) */
    }

这会缩小“竞赛窗口”,因为现在当你在“做一些工作”代码时,你会发现中断。但是还有一场比赛,因为在测试变量之后就会发生中断,但是之前选择或轮询。

解决方案是使用sigprocmask的信号阻塞属性(或者,在POSIX线程代码中,pthread_sigmask)使“测试,然后等待”序列“原子”:

sigset_t mask, omask;
...
while (!got_interrupted) {
    ... do some work ...
    /* begin critical section, test got_interrupted atomically */
    sigemptyset(&mask);
    sigaddset(&mask, SIGINT);
    if (sigprocmask(SIG_BLOCK, &mask, &omask))
        ... handle error ...
    if (got_interrupted) {
        sigprocmask(SIG_SETMASK, &omask, NULL); /* restore old signal mask */
        break;
    }
    result = pselect(..., &omask); /* or ppoll() etc */
    sigprocmask(SIG_SETMASK, &omask, NULL);
    /* end critical section */
}

(上面的代码实际上并不那么好,它的结构是为了说明而不是效率 - 使信号掩码操作稍微有点不同,并以不同的方式放置“被中断”的测试。)

直到你真正开始需要捕捉SIGINT,你只需要比较select()poll()(如果你开始需要大量的描述符,一些基于事件的像epoll()之类的东西比任何一个都更有效。

答案 1 :(得分:5)

在(p)选择和(p)民意调查之间是一个相当微妙的差异:

对于select,您必须在调用select之前每次初始化并填充丑陋的fd_set位图,因为select以“破坏性”方式就地修改它们。 (民意调查区分.events中的.reventsstruct pollfd成员。

选择后,即使大多数fds都没有被观看,整个位图也经常被(人/代码)扫描。

第三,位图只能处理数量小于某个限制的fds(当代实现:介于1024 ...... 4096之间),这可以在可以轻松获得高fds的程序中对其进行规则(尽管这些程序很简单)很可能已经使用了epoll而已。)

答案 2 :(得分:2)

对于select和pselect之间的差异,接受的答案是不正确的。它确实描述了sig-handler和select之间的竞争条件如何产生,但是它如何使用pselect来解决问题是不正确的。它忽略了关于pselect的主要观点,即它等待文件描述符或信号准备就绪。当其中任何一个准备就绪时,pselect返回.Select ONLY等待文件描述符。选择忽略信号。有关一个好的工作示例,请参阅此博客文章: https://www.linuxprogrammingblog.com/code-examples/using-pselect-to-avoid-a-signal-race

答案 3 :(得分:0)

要使被接受的答案呈现的图片完整,应提及以下基本事实:select()和pselect()都可以返回手册页中所述的EINTR:

  

EINTR捕获到一个信号;参见signal(7)。

此“捕获”意味着信号应被识别为“在系统调用执行期间发生”:
1.如果在执行 选择/ pselect执行过程中发生非屏蔽信号,则选择/ pselect 将退出
2.如果未屏蔽信号出现在之前之前,则此将不会生效,并且select / pselect将继续等待,可能永远

因此,如果在执行select / pselect期间发生信号,我们可以-选择/ pselect的执行将被中断,然后我们可以测试退出原因并发现是EINTR,然后可以退出循环。
我们面临的真正威胁是在select / pselect执行之外可能发生信号,然后我们可能会永远挂在系统调用中。任何通过天真手段发现此“局外人”信号的尝试:

  

if(was_a_signal){
     ...
    }

将失败,因为无论此测试与select / pselect的调用有多接近,总是有信号会在测试之后和select / pselect的调用之前出现。
然后,如果唯一捕捉信号的地方是在执行select / pselect的过程中,我们应该发明一种“酒漏斗” ,这样,所有的“酒溅”(信号),甚至在“瓶颈”之外(select / pselect执行期)最终会出现“瓶颈”。
但是,如何欺骗系统调用并使它“思考”该信号实际上是在此系统调用执行期间发生的呢?
简单。这是我们的“酒漏斗” :您只是阻止了感兴趣的信号,并因此而(如果根本没有发生)导致它在过程外部中等待“只有在您准备好“欢迎客人”(select / pselect正在运行)时,您才“打开门”(取消屏蔽信号)。然后,“到达”信号将被识别为“恰好发生”,并将中断系统调用的执行。
当然,“开门”是计划中最关键的部分-它不能通过通常的方式来完成(首先取消屏蔽,然后调用select / pselect),唯一的可能是同时执行这两项操作(取消屏蔽和系统处理) (原子)调用-这是pselect()的能力,而select()不能的