Perl中的非阻塞I / O操作是否仅限于一个线程?好的设计?

时间:2009-07-02 14:27:21

标签: perl multithreading sockets nonblocking

我正在尝试开发一个服务,其中包含许多客户端和服务器套接字(服务器服务以及连接到托管组件并保持不变的客户端),这些服务器通过IO::Select进行同步轮询。我们的想法是处理I / O和/或请求通过工作线程池产生的处理需求。

使{Pl}中的线程可共享数据的shared关键字有其限制 - 句柄引用不属于可共享的基元。

在我发现无法共享句柄和/或句柄引用之前,计划是使用threads::shared线程来处理轮询,然后将相关句柄放在某些select()中s遍布线程池实际进行读写。 (当然,我是这样设计的,以便对ThreadQueue使用的实际描述符集的修改将是线程安全的,并且仅在一个线程中发生 - 与运行select的那个相同,并且因此,从来没有在它运行时,显然。)

现在似乎不会发生这种情况,因为句柄本身无法共享,因此轮询以及读取和写入都需要从一个线程发生。这有什么解决方法吗?我指的是跨线程的实际系统调用的分解;很明显,有一些方法可以使用队列和缓冲区来在其他线程中生成数据并实际在其他线程中发送。

这种情况产生的一个问题是我必须给select()一个超时,并且期望它足够高,不会导致轮询相当大的描述符集的任何问题,而不足够低在我的计时事件循环中引入了太多延迟 - 尽管如此,我确实理解如果在轮询过程中检测到实际的I / O集成员资格,select()将提前返回,这部分缓解了问题。我宁愿有一些方法从另一个线程唤醒select(),但由于句柄无法共享,我不能轻易想到这样做的方法,也不能看到这样做的价值;什么是其他线程知道什么时候适当唤醒select()

如果没有解决方法,Perl中此类服务的优秀设计模式是什么?我需要相当大的可伸缩性和并发I / O,因此出于非阻塞路由而不是仅为每个侦听套接字和/或客户端和/或服务器进程生成线程,因为许多人使用更高的 - 现在,在处理套接字时,这些语言是不习惯的 - 它似乎是Java领域的一种标准做法,似乎没有人关心select()超出系统导向编程的狭隘领域。也许这只是我的印象。无论如何,我不想这样做。

因此,从经验丰富的Perl系统程序员的角度来看,这些东西应该如何组织?单片I / O线程+纯工作线程(非I / O)线程+大量队列?某种聪明的黑客?除了我已经列举的内容之外,任何线程安全都需要注意?有没有更好的办法?我在使用C语言设计此类程序方面拥有丰富的经验,但没有使用Perl习语或运行时特性。

编辑:P.S。我肯定想过,也许具有这些性能要求的程序和这种设计不应该用Perl编写。但我看到在Perl中生成了大量非常复杂的服务,所以我不确定。

1 个答案:

答案 0 :(得分:5)

包括你的几个更大的设计问题,我可以提供一些方法来跨perl线程共享文件句柄。

可以将$client传递给线程启动例程,或者只是在新线程中引用它:

$client = $server_socket->accept();

threads->new(\&handle_client, $client);
async { handle_client($client) };
# $client will be closed only when all threads' references
# to it pass out of scope.

对于Thread::Queue设计,可以enqueue()基础fd:

$q->enqueue( POSIX::dup(fileno $client) );
# we dup(2) so that $client may safely go out of scope,
# closing its underlying fd but not the duplicate thereof

async {
  my $client = IO::Handle->new_from_fd( $q->dequeue, "r+" );
  handle_client($client);
};

或者可以只使用fds,以及Perl的select的位向量形式。