我有一个perl脚本,它将大量输出发送到多个子进程。我需要能够关闭所有管道的末端,然后等待子流程完成他们的工作。到目前为止,我只是成功地关闭了每个管道并等待每个子进程逐个完成。 更具体地说,我正在做这样的事情:
for ($i=0;$i<24;$i++) {
my $fh;
open $fh, "|externalprogram $i";
$fhs{$i}=$fh;
}
#...now I can write output to the pipes
while (moreworktodo()) {
$whichone, $data = do_some_work();
print $fhs{$whichone} $data;
}
#Now I just need to wait for all the subprocesses to finish. However, they
#need to do a lot of work that can only begin when they've finished reading input. So I need to close my end of the pipe to indicate I'm finished.
for ($i=0;$i<24;$i++) {
my $file = $fhs{$i};
close $file; #unfortunately, this blocks until process $i finishes
#meanwhile all the other processes are waiting for EOF
#on their STDIN before they can proceed. So I end up waiting
#for 24 processes to finish one-at-a-time instead of all at once
}
让所有子进程快速完成(关闭stdin)的一种方法就是让我的脚本退出而不关闭(管道)文件句柄,但这并不好,因为脚本是需要更大工作的一部分子流程'在继续之前实际完成的工作。
关闭每个子进程的stdin的简单方法是什么(以便它们都可以完成工作)然后在继续之前等待所有子进程完成?我试图让一个孩子关闭每个管道,但这似乎不起作用 - 只有父的“关闭”实际上关闭了子进程的stdin并等待子进程完成。
答案 0 :(得分:5)
我会自己创建管道而不是open(P, "|external-program")
。
然后你可以关闭管道而不是等待子进程退出。
自己打开管道到子进程的示例:
sub spawn {
my ($cmd) = @_;
pipe(my $rp, $wp) or die "pipe failed: $!";
my $pid = fork();
die "fork: $!" unless defined($pid);
if ($pid) {
# parent
close($rp);
return ($wp, $pid);
} else {
# child
close($wp);
open(STDIN, "<&", $rp);
exec($cmd) or die "exec: $!";
}
}
sub main {
$| = 1;
my ($wp, $pid) = spawn("./child");
for (1..10) {
print {$wp} "sending $_\n";
}
close($wp);
print "done\n";
}
main();
这是一个示例子程序,用于测试close()
是否等待孩子退出:
# file: ./child
while (<STDIN>) {
print "got: $_";
sleep(2);
}
最后一个难题是异步等待子进程退出。
这可以使用$SIG{CHLD}
处理程序完成,或者,这是一个简单的“join_children”函数:
my @child_ids = (1..24); # or whatever ids you want to use
my %pipe; # hash map from child_id -> pipe handle
sub join_children {
for my $id (@child_ids) {
close( $pipe{$id} );
}
my $count = scalar(@child_ids);
while ($count > 0) {
wait;
$count--;
}
}