POSIX进程组

时间:2009-06-26 01:16:03

标签: c process posix

我目前正在将进程组实现到我的操作系统项目的POSIX子系统中。但是,我对POSIX specification (setsid)(以及维基百科有关流程组的页面)感到有些困惑。

我们的终端层将SIGINT发送到前台进程(组,其id应该等于组长的PID)。在这种情况下,该前台进程(我们的“登录”应用程序)通过调用setsid成为组长。当用户登录时,程序会分叉并执行用户的shell。在这个阶段,我的理解是,在调用setpgid之前,我从分叉的孩子那里打电话给exec*。这意味着执行的程序从一开始就是过程组的一部分。

如果我想在进程组外部运行新分叉的子进程,我只需在分叉的子进程中调用setsid,然后再调用exec*

这是对的吗?是否有任何我应该检查或做的非常模糊的事情?

作为后续问题,我相信我已经知道,fork是否需要转移群组成员资格?或者,每次setpgid通话后,是否必须使用fork进行操作?我收集的流程组由forkfork的POSIX定义传输。

提前致谢。

2 个答案:

答案 0 :(得分:15)

答案 1 :(得分:0)

setpgid POSIX C流程组最小示例

我相信,使用基本的API通常是学习新概念的最佳方法,所以让我们尝试一下。

这说明了如果孩子未使用setpgid更改其处理组,则如何将信号发送给孩子。

main.c

#define _XOPEN_SOURCE 700
#include <assert.h>
#include <signal.h>
#include <stdbool.h>
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

volatile sig_atomic_t is_child = 0;

void signal_handler(int sig) {
    char parent_str[] = "sigint parent\n";
    char child_str[] = "sigint child\n";
    signal(sig, signal_handler);
    if (sig == SIGINT) {
        if (is_child) {
            write(STDOUT_FILENO, child_str, sizeof(child_str) - 1);
        } else {
            write(STDOUT_FILENO, parent_str, sizeof(parent_str) - 1);
        }
    }
}

int main(int argc, char **argv) {
    pid_t pid, pgid;

    (void)argv;
    signal(SIGINT, signal_handler);
    signal(SIGUSR1, signal_handler);
    pid = fork();
    assert(pid != -1);
    if (pid == 0) {
        /* Change the pgid.
         * The new one is guaranteed to be different than the previous, which was equal to the parent's,
         * because `man setpgid` says:
         * > the child has its own unique process ID, and this PID does not match
         * > the ID of any existing process group (setpgid(2)) or session.
         */
        is_child = 1;
        if (argc > 1) {
            setpgid(0, 0);
        }
        printf("child pid, pgid = %ju, %ju\n", (uintmax_t)getpid(), (uintmax_t)getpgid(0));
        assert(kill(getppid(), SIGUSR1) == 0);
        while (1);
        exit(EXIT_SUCCESS);
    }
    /* Wait until the child sends a SIGUSR1. */
    pause();
    pgid = getpgid(0);
    printf("parent pid, pgid = %ju, %ju\n", (uintmax_t)getpid(), (uintmax_t)pgid);
    /* man kill explains that negative first argument means to send a signal to a process group. */
    kill(-pgid, SIGINT);
    while (1);
}

GitHub upstream

编译为:

gcc -ggdb3 -O0 -std=c99 -Wall -Wextra -Wpedantic -o setpgid setpgid.c

不使用setpgid

运行

没有任何CLI参数,setpgid不会完成:

./setpgid

可能的结果:

child pid, pgid = 28250, 28249
parent pid, pgid = 28249, 28249
sigint parent
sigint child

并且程序挂起。

我们可以看到,两个进程的pgid都是一样的,因为它们是跨fork继承的。

然后每当您点击:

Ctrl + C

它再次输出:

sigint parent
sigint child

这显示了如何:

  • 使用kill(-pgid, SIGINT)向整个过程组发送信号
  • 默认情况下,终端上的Ctrl + C会向整个进程组发送一次kill

通过向两个进程发送不同的信号来退出程序,例如SIGQUIT与Ctrl + \

运行setpgid

如果使用参数运行,例如:

./setpgid 1

然后,孩子更改其pgid,现在每次仅从父级打印一次sigint:

child pid, pgid = 16470, 16470
parent pid, pgid = 16469, 16469
sigint parent

现在,只要您按下:

Ctrl + C

只有父母也收到信号:

sigint parent

您仍然可以像以前一样使用SIGQUIT杀死父母:

Ctrl + \

但是,孩子现在有一个不同的PGID,并且没有收到该信号!从中可以看出:

ps aux | grep setpgid

您将必须使用以下命令明确杀死它:

kill -9 16470

这清楚表明了为什么存在信号组:否则,我们将剩下一堆进程,这些进程始终需要手动进行清理。

在Ubuntu 18.04上测试。