如何列出挂起的mpi作业

时间:2013-05-23 13:05:51

标签: mpi jobs mpich

我正在使用mpiexec(mpich2)运行一些工作 mpiexec进程以非零状态退出,留下一些工作进程

我可以打印正在运行的子作业列表:

$ps aux | grep mpi

是否有其他方法可以列出正在运行/挂起的作业?

2 个答案:

答案 0 :(得分:0)

如果MPI离开僵尸进程(这很奇怪,这确实不应该发生),它将被命名为您最初执行的可执行文件。所以如果你用以下方式开始你的程序:

mpiexec -n 4 ./a.out

然后你需要搜索

ps aux | grep a.out

将为您提供所有仍在闲逛的流程列表。您建议的内容通常不起作用的原因是,如果mpirunmpiexec进程已经消失(由于崩溃或完成),您显然无法继续搜索它。但是,由于某种原因,孩子们可能仍然会出现这种情况。

答案 1 :(得分:-1)

这可能会对你有所帮助:ps aux | grep MPICH