使用mpirun选项在群集上并行运行单个MPI可执行文件的多个实例?

时间:2015-04-08 18:47:56

标签: parallel-processing mpi cluster-computing sungridengine

我正在尝试编写一个shell脚本来执行某种算法,其中一部分需要在Grid Engine集群上的多个输入文件上并行执行MPI可执行文件。根据我的阅读,似乎mpirun通过使用冒号或使用应用程序上下文/模式文件然后执行mpirun --app my_appfile来支持MPMD执行。以下是我my_appfile的样子,

-np 12 /path/to/executable /path/to/dir1/input1
-np 12 /path/to/executable /path/to/dir2/input2
-np 12 /path/to/executable /path/to/dir3/input3
...
-np 12 /path/to/executable /path/to/dir10/input10

我试图并行执行相同可执行文件的10个实例,并相应地分配集群中的资源(在这种情况下,在SGE的并行环境中有120个进程)。

然而,有一个问题。编写每个输入文件以在与每个特定输入文件相同的目录中生成输出。当我提交作业(提交脚本仅包含mpirun --app my_appfile行)时,它仅显示dir1中input1的输出,但不显示其余的输出。所以我想知道这里的问题是什么。这是mpirun选项的问题还是群集如何完成工作的问题?任何帮助将受到高度赞赏。谢谢!

0 个答案:

没有答案