如何在不阻塞Rust的情况下读取子进程的输出?

时间:2016-01-05 12:28:26

标签: process io rust blocking pty

我在Rust中创建了一个小的ncurses应用程序,需要与子进程通信。我已经有了一个用Common Lisp编写的原型。我正在尝试重写它,因为CL为这么小的工具使用了大量的内存。

我在弄清楚如何与子流程进行交互时遇到了一些麻烦。

我目前正在做的大致是:

  1. 创建流程:

    let mut program = match Command::new(command)
        .args(arguments)
        .stdin(Stdio::piped())
        .stdout(Stdio::piped())
        .stderr(Stdio::piped())
        .spawn()
    {
        Ok(child) => child,
        Err(_) => {
            println!("Cannot run program '{}'.", command);
            return;
        }
    };
    
  2. 将其传递给无限(直到用户退出)循环,该循环读取并处理输入并侦听此类输出(并将其写入屏幕):

    fn listen_for_output(program: &mut Child, output_viewer: &TextViewer) {
        match program.stdout {
            Some(ref mut out) => {
                let mut buf_string = String::new();
                match out.read_to_string(&mut buf_string) {
                    Ok(_) => output_viewer.append_string(buf_string),
                    Err(_) => return,
                };
            }
            None => return,
        };
    }
    
  3. 然而,对read_to_string的调用会阻止程序直到进程退出。从我所看到的read_to_endread似乎也阻止了。如果我尝试运行类似ls的东西,它会立即退出,但它有效,但有些内容不会像pythonsbcl那样退出,只有在我手动终止子进程后才会继续。< / p>

    根据this answer,我将代码更改为使用BufReader

        fn listen_for_output(program: &mut Child, output_viewer: &TextViewer) {
            match program.stdout.as_mut() {
                Some(out) => {
                    let buf_reader = BufReader::new(out);
                    for line in buf_reader.lines() {
                        match line {
                            Ok(l) => {
                                output_viewer.append_string(l);
                            }
                            Err(_) => return,
                        };
                    }
                }
                None => return,
            }
        }
    

    然而,问题仍然存在。它将读取所有可用的行,然后阻止。由于该工具应该适用于任何程序,因此在尝试读取之前无法猜出输出何时结束。似乎没有办法为BufReader设置超时。

3 个答案:

答案 0 :(得分:12)

默认情况下,Streams 阻止。 TCP / IP流,文件系统流,管道流,它们都是阻塞的。当你告诉一个流给你一大块字节时,它会停止并等到它有给定的字节数或者发生其他事情(interrupt,流的结束,错误)。

操作系统急于将数据返回到读取过程,所以如果你想要的只是等待下一行并在它进入后立即处理它,那么Shepmaster在Unable to pipe to or from spawned child process more than once中建议的方法作品。 (理论上它没有必要,因为允许操作系统使BufReader等待read中的更多数据,但实际上操作系统更喜欢早期的“短读取”等待)。

当您需要处理多个流(如子进程的BufReaderstdout)或多个进程时,这种基于stderr的简单方法会停止工作。例如,基于BufReader的方法可能会在子进程等待您排空其stderr管道时遇到死锁,而您的进程被阻止等待它为空stdout

同样,如果您不希望程序无限期地等待子进程,则无法使用BufReader。也许你想在孩子还在工作的时候显示一个进度条或一个计时器而没有输出。

如果您的操作系统没有急于将数据返回到进程(更喜欢“完全读取”到“短读取”),则不能使用基于BufReader的方法,因为在这种情况下会有一些子进程打印的最后一行可能会在灰色区域中结束:操作系统获得它们,但它们不够大,无法填充BufReader的缓冲区。

BufReader仅限于Read接口允许它对流做的操作,它的阻塞程度不低于底层流。为了提高效率,它将read输入块,告诉操作系统尽可能多地填充缓冲区。

您可能想知道为什么在块中读取数据如此重要,为什么BufReader不能逐字节地读取数据。问题是要从流中读取数据,我们需要操作系统的帮助。另一方面,我们不是操作系统,我们与它隔离工作,以免在我们的流程出现问题时弄乱它。因此,为了调用操作系统,需要转换到“内核模式”,这也可能导致“上下文切换”。这就是调用操作系统读取每个字节的原因很昂贵。我们希望尽可能少的OS调用,因此我们分批获取流数据。

要在没有阻止的情况下等待流,您需要非阻塞流。 MIO promises to have the required non-blocking stream support for pipes,很可能是PipeReader,但到目前为止我还没有查看过。

流的非阻塞性质应该能够以块的形式读取数据,无论操作系统是否更喜欢“短读取”。因为非阻塞流永远不会阻塞。如果流中没有数据,它只会告诉您。

在缺少非阻塞流的情况下,您将不得不求助于生成线程,以便阻塞读取将在单独的线程中执行,因此不会阻止您的主线程。您可能还希望逐字节读取流,以便在操作系统不喜欢“短读取”时立即对行分隔符做出反应。这是一个有效的例子:https://gist.github.com/ArtemGr/db40ae04b431a95f2b78

答案 1 :(得分:2)

Tokio进程

以下是使用tokiotokio-process的示例。

use std::{
    io::BufReader,
    process::{Command, Stdio},
};
use tokio::{io, prelude::*, runtime::Runtime}; // 0.1.18
use tokio_process::CommandExt; // 0.2.3

fn main() {
    let mut cmd = Command::new("/tmp/slow.bash")
        .stdout(Stdio::piped())
        .spawn_async()
        .expect("cannot spawn");
    let stdout = cmd.stdout().take().expect("no stdout");

    let mut runtime = Runtime::new().expect("Unable to start the runtime");

    let result = runtime.block_on({
        io::lines(BufReader::new(stdout))
            .inspect(|s| println!("> {}", s))
            .collect()
    });

    println!("All the lines: {:?}", result);
}

Tokio-线程池

以下是使用tokiotokio-threadpool的示例。我们使用blocking函数在线程中启动该过程。我们使用stream::poll_fn

将其转换为流
use std::process::{Command, Stdio};
use tokio::{prelude::*, runtime::Runtime}; // 0.1.18
use tokio_threadpool; // 0.1.13

fn stream_command_output(
    mut command: Command,
) -> impl Stream<Item = Vec<u8>, Error = tokio_threadpool::BlockingError> {
    // Ensure that the output is available to read from and start the process
    let mut child = command
        .stdout(Stdio::piped())
        .spawn()
        .expect("cannot spawn");
    let mut stdout = child.stdout.take().expect("no stdout");

    // Create a stream of data
    stream::poll_fn(move || {
        // Perform blocking IO
        tokio_threadpool::blocking(|| {
            // Allocate some space to store anything read
            let mut data = vec![0; 128];
            // Read 1-128 bytes of data
            let n_bytes_read = stdout.read(&mut data).expect("cannot read");

            if n_bytes_read == 0 {
                // Stdout is done
                None
            } else {
                // Only return as many bytes as we read
                data.truncate(n_bytes_read);
                Some(data)
            }
        })
    })
}

fn main() {
    let output_stream = stream_command_output(Command::new("/tmp/slow.bash"));

    let mut runtime = Runtime::new().expect("Unable to start the runtime");

    let result = runtime.block_on({
        output_stream
            .map(|d| String::from_utf8(d).expect("Not UTF-8"))
            .fold(Vec::new(), |mut v, s| {
                print!("> {}", s);
                v.push(s);
                Ok(v)
            })
    });

    println!("All the lines: {:?}", result);
}

在这里可以进行很多可能的权衡。例如,总是分配128个字节并不理想,但是实现起来很简单。

支持

作为参考,这里是 slow.bash

#!/usr/bin/env bash

set -eu

val=0

while [[ $val -lt 10 ]]; do
    echo $val
    val=$(($val + 1))
    sleep 1
done

另请参阅:

答案 2 :(得分:0)

如果 Unix 支持足够,您还可以将两个输出流设为非阻塞并轮询它们,就像您在 TcpStream 上使用 set_nonblocking 函数所做的那样。

Command spawn 返回的 ChildStdoutChildStderrStdio(并包含一个文件描述符),您可以直接修改这些句柄的读取行为,使其成为非阻塞的.

基于jcreekmore/timeout-readwrite-rsanowell/nonblock-rs的工作,我使用这个包装器来修改流句柄:

extern crate libc;
use std::io::Read;
use std::os::unix::io::AsRawFd;
use libc::{F_GETFL, F_SETFL, fcntl, O_NONBLOCK};

fn set_nonblocking<H>(handle: &H, nonblocking: bool) -> std::io::Result<()>
where
    H: Read + AsRawFd,
{
    let fd = handle.as_raw_fd();
    let flags = unsafe { fcntl(fd, F_GETFL, 0) };
    if flags < 0 {
        return Err(std::io::Error::last_os_error());
    }
    let flags = if nonblocking{
        flags | O_NONBLOCK
    } else {
        flags & !O_NONBLOCK
    };
    let res = unsafe { fcntl(fd, F_SETFL, flags) };
    if res != 0 {
        return Err(std::io::Error::last_os_error());
    }
    Ok(())
}

您可以像管理任何其他非阻塞流一样管理这两个流。以下示例基于 polling 板条箱,它非常容易处理读取事件和 BufReader 用于行读取:

use std::process::{Command, Stdio};
use std::path::PathBuf;
use std::io::{BufReader, BufRead};
use std::thread;
extern crate polling;
use polling::{Event, Poller};

fn main() -> Result<(), std::io::Error> {
    let path = PathBuf::from("./worker.sh").canonicalize()?;

    let mut child = Command::new(path)
        .stdin(Stdio::null())
        .stdout(Stdio::piped())
        .stderr(Stdio::piped())
        .spawn()
        .expect("Failed to start worker");

    let handle = thread::spawn({
        let stdout = child.stdout.take().unwrap();
        set_nonblocking(&stdout, true)?;
        let mut reader_out = BufReader::new(stdout);

        let stderr = child.stderr.take().unwrap();
        set_nonblocking(&stderr, true)?;
        let mut reader_err = BufReader::new(stderr);

        move || {
            let key_out = 1;
            let key_err = 2;
            let mut out_closed = false;
            let mut err_closed = false;

            let poller = Poller::new().unwrap();
            poller.add(reader_out.get_ref(), Event::readable(key_out)).unwrap();
            poller.add(reader_err.get_ref(), Event::readable(key_err)).unwrap();

            let mut line = String::new();
            let mut events = Vec::new();
            loop {
                // Wait for at least one I/O event.
                events.clear();
                poller.wait(&mut events, None).unwrap();

                for ev in &events {
                    // stdout is ready for reading
                    if ev.key == key_out {
                        let len = match reader_out.read_line(&mut line) {
                            Ok(len) => len,
                            Err(e) => {
                                println!("stdout read returned error: {}", e);
                                0
                            }
                        };
                        if len == 0 {
                            println!("stdout closed (len is null)");
                            out_closed = true;
                            poller.delete(reader_out.get_ref()).unwrap();
                        } else {
                            print!("[STDOUT] {}", line);
                            line.clear();
                            // reload the poller
                            poller.modify(reader_out.get_ref(), Event::readable(key_out)).unwrap();
                        }
                    }

                    // stderr is ready for reading
                    if ev.key == key_err {
                        let len = match reader_err.read_line(&mut line) {
                            Ok(len) => len,
                            Err(e) => {
                                println!("stderr read returned error: {}", e);
                                0
                            }
                        };
                        if len == 0 {
                            println!("stderr closed (len is null)");
                            err_closed = true;
                            poller.delete(reader_err.get_ref()).unwrap();
                        } else {
                            print!("[STDERR] {}", line);
                            line.clear();
                            // reload the poller
                            poller.modify(reader_err.get_ref(), Event::readable(key_err)).unwrap();
                        }
                    }
                }

                if out_closed && err_closed {
                    println!("Stream closed, exiting process thread");
                    break;
                }
            }
        }
    });

    handle.join().unwrap();
    Ok(())
}

此外,与 EventFd 上的包装器一起使用,可以轻松地从另一个线程停止进程,而不会阻塞,也不会主动轮询,并且仅使用单个线程。

编辑: 在我的测试之后,似乎轮询箱会在非阻塞模式下自动设置轮询句柄。如果你想直接使用 nix::poll 对象,set_nonblocking 函数仍然很有用。