我正在尝试使用openmpi和mpirun在debian 7上运行这个示例hello world程序。
#include <stdio.h>
#include <mpi/mpi.h>
int main (int argc, char **argv) {
int nProcId, nProcNo;
int nNameLen;
char szMachineName[MPI_MAX_PROCESSOR_NAME];
MPI_Init (&argc, &argv); // Start up MPI
MPI_Comm_size (MPI_COMM_WORLD,&nProcNo); // Find out number of processes
MPI_Comm_rank (MPI_COMM_WORLD, &nProcId); // Find out process rank
MPI_Get_processor_name (szMachineName, &nNameLen); // Get machine name
printf ("Hello World from process %d on %s\r\n", nProcId, szMachineName);
if (nProcId == 0)
printf ("Number of Processes: %d\r\n", nProcNo);
MPI_Finalize (); // Shut down MPI
return 0;
}
我的问题是MPI_Comm_Rank
为进程的所有副本返回0。当我在shell上运行此命令时:
mpirun -np 4 helloWorld
它产生这个输出:
Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1
为什么进程数仍为1?
答案 0 :(得分:13)
确保mpicc
和mpirun
来自相同的MPI实施。当mpirun
无法向已启动的进程提供必要的Universe信息时,最常见的原因是可执行文件是针对不同的MPI实现(甚至是同一实现的不同版本)构建的,{{{ 1}}回退到所谓的单例MPI初始化并创建一个仅包含调用进程的MPI_Init()
。因此,结果是在它们各自的MPI_COMM_WORLD
实例中的许多MPI进程。
通常MPI_COMM_WORLD
,mpicc --showme
和which mpicc
等命令可以帮助您确定是否确实如此。