waitpid / wexitstatus返回0而不是正确的返回码

时间:2012-11-01 17:09:16

标签: c++ c linux waitpid wexitstatus

我有下面的帮助函数,用于执行命令并在posix系统上获取返回值。我过去常常使用popen,但是如果应用程序在popen / popen有机会运行之前运行并退出,则无法获取pclose的应用程序的返回代码它的工作。

以下帮助函数创建一个进程fork,使用execvp运行所需的外部进程,然后父进程使用waitpid来获取返回代码。我看到奇怪的情况,它拒绝运行。

使用wait = true进行调用时,waitpid应该返回应用程序的退出代码,无论如何。但是,我看到stdout输出指定返回代码应该为非零,但返回代码为零。在常规shell中测试外部进程,然后echo ing $?返回非零值,因此外部进程没有返回正确的代码也不是问题。如果它有任何帮助,那么正在运行的外部进程是mount(8)(是的,我知道我可以使用mount(2),但除了这一点之外)。

我提前为代码转储道歉。大多数是调试/记录:

inline int ForkAndRun(const std::string &command, const std::vector<std::string> &args, bool wait = false, std::string *output = NULL)
{
    std::string debug;

    std::vector<char*> argv;
    for(size_t i = 0; i < args.size(); ++i)
    {
        argv.push_back(const_cast<char*>(args[i].c_str()));
        debug += "\"";
        debug += args[i];
        debug += "\" ";
    }
    argv.push_back((char*)NULL);

    neosmart::logger.Debug("Executing %s", debug.c_str());

    int pipefd[2];

    if (pipe(pipefd) != 0)
    {
        neosmart::logger.Error("Failed to create pipe descriptor when trying to launch %s", debug.c_str());
        return EXIT_FAILURE;
    }

    pid_t pid = fork();

    if (pid == 0)
    {
        close(pipefd[STDIN_FILENO]); //child isn't going to be reading
        dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
        close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd
        dup2(pipefd[STDOUT_FILENO], STDERR_FILENO);

        if (execvp(command.c_str(), &argv[0]) != 0)
        {
            exit(EXIT_FAILURE);
        }
        return 0;
    }
    else if (pid < 0)
    {
        neosmart::logger.Error("Failed to fork when trying to launch %s", debug.c_str());
        return EXIT_FAILURE;
    }
    else
    {
        close(pipefd[STDOUT_FILENO]);

        int exitCode = 0;

        if (wait)
        {
            waitpid(pid, &exitCode, wait ? __WALL : (WNOHANG | WUNTRACED));

            std::string result;
            char buffer[128];
            ssize_t bytesRead;
            while ((bytesRead = read(pipefd[STDIN_FILENO], buffer, sizeof(buffer)-1)) != 0)
            {
                buffer[bytesRead] = '\0';
                result += buffer;
            }

            if (wait)
            {
                if ((WIFEXITED(exitCode)) == 0)
                {
                    neosmart::logger.Error("Failed to run command %s", debug.c_str());
                    neosmart::logger.Info("Output:\n%s", result.c_str());
                }
                else
                {
                    neosmart::logger.Debug("Output:\n%s", result.c_str());
                    exitCode = WEXITSTATUS(exitCode);
                    if (exitCode != 0)
                    {
                        neosmart::logger.Info("Return code %d", (exitCode));
                    }
                }
            }

            if (output)
            {
                result.swap(*output);
            }
        }

        close(pipefd[STDIN_FILENO]);

        return exitCode;
    }
}

请注意,使用正确的参数运行命令,函数运行正常,WIFEXITED返回TRUE。但是,WEXITSTATUS返回0时应该返回其他内容。

3 个答案:

答案 0 :(得分:2)

可能不是你的主要问题,但我认为我看到一个小问题。在您的子进程中,您有......

dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd
dup2(pipefd[STDOUT_FILENO], STDERR_FILENO); //but wait, this pipe is closed!

但我认为你想要的是:

dup2(pipefd[STDOUT_FILENO], STDOUT_FILENO);
dup2(pipefd[STDOUT_FILENO], STDERR_FILENO);
close(pipefd[STDOUT_FILENO]); //now that it's been dup2'd for both, can close

我对Linux中的分支和管道没有多少经验,但我最近写了一个类似的功能。如果您愿意,可以查看要比较的代码。我知道我的功能有效。

execAndRedirect.cpp

答案 1 :(得分:2)

我正在使用mongoose库,并且为我的SIGCHLD代码显示,使用来自mongoose的mg_start会导致将SIGCHLD设置为SIG_IGN

waitpid man page,在Linux上SIGCHLD设置为SIG_IGN不会创建僵尸进程,因此如果进程已成功运行并退出,则waitpid将失败 - 如果尚未运行,则运行正常。这是我的代码零星失败的原因。

在调用SIGCHLD之后简单地重新设置mg_start到一个无效的虚函数,足以让僵尸记录不被立即删除。

根据@Geoff_Montee's advice,我的STDERR重定向中存在一个错误,但由于execvp未将返回值存储在STDERR中,因此不对此问题负责甚至是STDOUT,而是在与父进程关联的内核对象(僵尸记录)中。

@jilles' warning关于C ++中vector的非连续性不适用于C ++ 03及更高版本(仅对C ++ 98有效,但在实践中,大多数C ++ 98编译器都是无论如何都使用连续存储,并且与此问题无关。但是,在阻止和检查waitpid的输出之前从管道读取的建议是可靠的。

答案 2 :(得分:0)

我发现pclose不阻止并等待进程结束,这与文档相反(这是在CentOS 6上)。我发现我需要调用pclose然后调用waitpid(pid,&status,0);来获取真正的返回值。