Question

我有下面的帮助函数，用于执行命令并在posix系统上获取返回值。我过去常常使用popen，但是如果应用程序在popen / popen有机会运行之前运行并退出，则无法获取pclose的应用程序的返回代码它的工作。

以下帮助函数创建一个进程fork，使用execvp运行所需的外部进程，然后父进程使用waitpid来获取返回代码。我看到奇怪的情况，它拒绝运行。

使用wait = true进行调用时，waitpid应该返回应用程序的退出代码，无论如何。但是，我看到stdout输出指定返回代码应该为非零，但返回代码为零。在常规shell中测试外部进程，然后echo ing $?返回非零值，因此外部进程没有返回正确的代码也不是问题。如果它有任何帮助，那么正在运行的外部进程是mount(8)（是的，我知道我可以使用mount(2)，但除了这一点之外）。

我提前为代码转储道歉。大多数是调试/记录：

inline int ForkAndRun(const std::string &command, const std::vector<std::string> &args, bool wait = false, std::string *output = NULL)
{
    std::string debug;

    std::vector<char*> argv;
    for(size_t i = 0; i < args.size(); ++i)
    {
        argv.push_back(const_cast<char*>(args[i].c_str()));
        debug += "\"";
        debug += args[i];
        debug += "\" ";
    }
    argv.push_back((char*)NULL);

    neosmart::logger.Debug("Executing %s", debug.c_str());

    int pipefd[2];

    if (pipe(pipefd) != 0)
    {
        neosmart::logger.Error("Failed to create pipe descriptor when trying to launch %s", debug.c_str());
        return EXIT_FAILURE;
    }

    pid_t pid = fork();

    if (pid == 0)
    {
        close(pipefd[STDIN_FILENO]); //child isn't going to be reading
        dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
        close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd
        dup2(pipefd[STDOUT_FILENO], STDERR_FILENO);

        if (execvp(command.c_str(), &argv[0]) != 0)
        {
            exit(EXIT_FAILURE);
        }
        return 0;
    }
    else if (pid < 0)
    {
        neosmart::logger.Error("Failed to fork when trying to launch %s", debug.c_str());
        return EXIT_FAILURE;
    }
    else
    {
        close(pipefd[STDOUT_FILENO]);

        int exitCode = 0;

        if (wait)
        {
            waitpid(pid, &exitCode, wait ? __WALL : (WNOHANG | WUNTRACED));

            std::string result;
            char buffer[128];
            ssize_t bytesRead;
            while ((bytesRead = read(pipefd[STDIN_FILENO], buffer, sizeof(buffer)-1)) != 0)
            {
                buffer[bytesRead] = '\0';
                result += buffer;
            }

            if (wait)
            {
                if ((WIFEXITED(exitCode)) == 0)
                {
                    neosmart::logger.Error("Failed to run command %s", debug.c_str());
                    neosmart::logger.Info("Output:\n%s", result.c_str());
                }
                else
                {
                    neosmart::logger.Debug("Output:\n%s", result.c_str());
                    exitCode = WEXITSTATUS(exitCode);
                    if (exitCode != 0)
                    {
                        neosmart::logger.Info("Return code %d", (exitCode));
                    }
                }
            }

            if (output)
            {
                result.swap(*output);
            }
        }

        close(pipefd[STDIN_FILENO]);

        return exitCode;
    }
}

请注意，使用正确的参数运行命令，函数运行正常，WIFEXITED返回TRUE。但是，WEXITSTATUS返回0时应该返回其他内容。

Answer 1

可能不是你的主要问题，但我认为我看到一个小问题。在您的子进程中，您有......

dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd
dup2(pipefd[STDOUT_FILENO], STDERR_FILENO); //but wait, this pipe is closed!

但我认为你想要的是：

dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
dup2(pipefd[STDOUT_FILENO], STDERR_FILENO);
close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd for both, can close

我对Linux中的分支和管道没有多少经验，但我最近写了一个类似的功能。如果您愿意，可以查看要比较的代码。我知道我的功能有效。

execAndRedirect.cpp

Answer 2

我正在使用mongoose库，并且为我的SIGCHLD代码显示，使用来自mongoose的mg_start会导致将SIGCHLD设置为SIG_IGN。

从waitpid man page，在Linux上SIGCHLD设置为SIG_IGN不会创建僵尸进程，因此如果进程已成功运行并退出，则waitpid将失败 - 如果尚未运行，则运行正常。这是我的代码零星失败的原因。

在调用SIGCHLD之后简单地重新设置mg_start到一个无效的虚函数，足以让僵尸记录不被立即删除。

根据@Geoff_Montee's advice，我的STDERR重定向中存在一个错误，但由于execvp未将返回值存储在STDERR中，因此不对此问题负责甚至是STDOUT，而是在与父进程关联的内核对象（僵尸记录）中。

@jilles' warning关于C ++中vector的非连续性不适用于C ++ 03及更高版本（仅对C ++ 98有效，但在实践中，大多数C ++ 98编译器都是无论如何都使用连续存储，并且与此问题无关。但是，在阻止和检查waitpid的输出之前从管道读取的建议是可靠的。

Answer 3

我发现pclose不阻止并等待进程结束，这与文档相反（这是在CentOS 6上）。我发现我需要调用pclose然后调用waitpid(pid,&status,0);来获取真正的返回值。

waitpid / wexitstatus返回0而不是正确的返回码

3 个答案: