我正在使用信号:SIGSTOP
和SIGCONT
。
这是我写的测试程序。我们的想法是创建一个N + 1链
流程(包括主流程)。每个人都要等孩子停下来,然后停下来
本身。主要过程必须唤醒后者的孩子
停止。
为此,f
函数以递归方式创建流程链。每个
该过程使用sigsuspend除{last}之外的SIGCHLD
信号
直接停止的孩子。当它的孩子停止时,一个过程
将收到SIGCHLD
信号,然后它可以停止。什么时候
主进程收到SIGCHLD
信号,表示全部
进程处于停止状态,因此它会向其发送SIGCONT
信号
儿童。每个进程将SIGCONT
发送给自己的子进程然后退出
来自最后一个退出的孩子。
我试图说清楚:删除了返回代码测试并写了一些 评价。
执行程序时,一切似乎都没问题,但是SIGCONT
链。有些进程被唤醒但并非所有进程都被唤醒。看着
运行程序(例如ps)一切似乎都很好:没有
阻止进程。我真的不明白这可能是错的
程序。欢迎任何帮助或暗示。
以下是示例跟踪。如你所见," fork chain"进展顺利,进程暂停在SIGCHLD
。然后最后一个孩子产生并停止。这会创建一个" SIGCHLD
链"因为每个过程都会自行停止。当主进程收到通知SIGCHLD
时,它会向其子级发送SIGCONT
,该子级会被唤醒,然后将SIGCONT
发送给自己的子级等。您可以注意到此链是不完整:
$ ./bin/trycont
n pid log
0 6257 "suspending on SIGCHLD"
1 6258 "suspending on SIGCHLD"
2 6259 "suspending on SIGCHLD"
3 6260 "suspending on SIGCHLD"
4 6261 "suspending on SIGCHLD"
5 6262 "last child - stopping"
4 6261 "got SIGCHLD"
4 6261 "stopping"
3 6260 "got SIGCHLD"
3 6260 "stopping"
2 6259 "got SIGCHLD"
2 6259 "stopping"
1 6258 "got SIGCHLD"
1 6258 "stopping"
0 6257 "got SIGCHLD"
0 6257 "sending SIGCONT to 6258"
1 6258 "awakened - sending SIGCONT to 6259"
2 6259 "awakened - sending SIGCONT to 6260"
# <- not the expected trace
以下是该计划:src/trycont.c
#include <stdlib.h>
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
/* number of created processes with fork
*/
#define N 5
#define printHeader() printf("n\tpid\tlog\n");
#define printMsg(i, p, str, ...) printf("%d\t%d\t" #str "\n", i, p, ##__VA_ARGS__)
void f(int n);
void handler(int sig);
sigset_t set;
struct sigaction action;
int main(int argc, char *argv[])
{
/* mask SIGCHLD
*/
sigemptyset(&set);
sigaddset(&set, SIGCHLD);
sigprocmask(SIG_SETMASK, &set, NULL);
/* handler will be called when SIGCHLD is sent to the process
* during the handler, SIGCHLD will be masked (sa_mask)
*/
action.sa_mask = set;
action.sa_handler = handler;
action.sa_flags = 0;
/* SIGCHLD will trigger action
*/
sigaction(SIGCHLD, &action, NULL);
/* start
*/
printHeader();
f(N);
exit(EXIT_SUCCESS);
}
void f(int n)
{
pid_t p, pc;
int myIndex;
myIndex = N - n;
p = getpid();
if (n == 0)
{
/* last child
*/
printMsg(myIndex, p, "last child - stopping");
kill(p, SIGSTOP);
printMsg(myIndex, p, "END REACHED");
exit(EXIT_SUCCESS);
}
pc = fork();
if (pc == 0)
{
/* recursion
*/
f(n - 1);
/* never reached
* because of exit
*/
}
/* father
*/
/* suspending on SIGCHLD
* need to unmask the signal
* and suspend
*/
printMsg(myIndex, p, "suspending on SIGCHLD");
sigfillset(&set);
sigdelset(&set, SIGCHLD);
sigsuspend(&set);
printMsg(myIndex, p, "got SIGCHLD");
if (n < N)
{
/* child process
* but not last
*/
printMsg(myIndex, p, "stopping");
kill(p, SIGSTOP);
printMsg(myIndex, p, "awakened - sending SIGCONT to %d", pc);
kill(pc, SIGCONT);
}
else
{
/* root process
*/
printMsg(myIndex, p, "sending SIGCONT to %d", pc);
kill(pc, SIGCONT);
}
exit(EXIT_SUCCESS);
}
void handler(int sig)
{
switch (sig)
{
case SIGCHLD:
/* when the process received SIGCHLD
* we can ignore upcoming SIGCHLD
*/
action.sa_handler = SIG_IGN;
sigaction(SIGCHLD, &action, NULL);
break;
default:
break;
}
}
如果您需要,这是一个Makefile:
CC=gcc
DEFINES=-D_POSIX_C_SOURCE
STD=-std=c11 -Wall -Werror
OPTS=-O2
CFLAGS=$(STD) $(DEFINES) $(OPTS) -g
LDFLAGS=
SRC=src
OBJ=obj
BIN=bin
DIRS=$(BIN) $(OBJ)
.PHONY: mkdirs clean distclean
all: mkdirs $(BIN)/trycont
$(BIN)/%: $(OBJ)/%.o
$(CC) $(CFLAGS) $(LDFLAGS) -o $@ $<
$(OBJ)/%.o: $(SRC)/%.c
$(CC) $(CFLAGS) -c -o $@ $<
mkdirs:
- mkdir $(DIRS)
clean:
rm -vf -- $(OBJ)/*.o
distclean: clean
rm -vfr -- $(DIRS)
答案 0 :(得分:2)
当第一个进程终止时,一些(全部?)你的后代进程正在死于系统生成的SIGHUP。
在某些情况下,这是expected POSIX behavior。
从shell启动根进程时,它是进程组负责人,其后代是该组的成员。当该领导者终止时,进程组孤立。当系统检测到任何成员停止的新孤立进程组时,进程组的每个成员都会发送一个SIGHUP,后跟一个SIGCONT。
因此,当领导者终止时,你的一些后代进程仍然停止,因此每个人都会收到一个SIGHUP,然后是SIGCONT,这实际上意味着他们死于SIGHUP。
究竟哪些后代仍然停止(或者甚至只是快乐地向exit()
前进)是一场时间竞赛。在我的系统上,领导者终止的速度很快,以至于没有后代可以打印任何东西。