MPI_Rank为所有进程返回相同的进程号

时间:2013-11-29 14:06:02

标签: mpi openmpi

我正在尝试使用openmpi和mpirun在debian 7上运行这个示例hello world程序。

#include <stdio.h>
#include <mpi/mpi.h>

int main (int argc, char **argv) {
   int nProcId, nProcNo;

   int nNameLen;
   char szMachineName[MPI_MAX_PROCESSOR_NAME];

   MPI_Init (&argc, &argv); // Start up MPI

   MPI_Comm_size (MPI_COMM_WORLD,&nProcNo); // Find out number of processes
   MPI_Comm_rank (MPI_COMM_WORLD, &nProcId); // Find out process rank
   MPI_Get_processor_name (szMachineName, &nNameLen); // Get machine name

   printf ("Hello World from process %d on %s\r\n", nProcId, szMachineName);

   if (nProcId == 0)
      printf ("Number of Processes: %d\r\n", nProcNo);

   MPI_Finalize (); // Shut down MPI

   return 0;
}

我的问题是MPI_Comm_Rank为进程的所有副本返回0。当我在shell上运行此命令时:

mpirun -np 4  helloWorld

它产生这个输出:

Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1
Hello World from process 0 on debian
Number of Processes: 1

为什么进程数仍为1?

1 个答案:

答案 0 :(得分:13)

确保mpiccmpirun来自相同的MPI实施。当mpirun无法向已启动的进程提供必要的Universe信息时,最常见的原因是可执行文件是针对不同的MPI实现(甚至是同一实现的不同版本)构建的,{{{ 1}}回退到所谓的单例MPI初始化并创建一个仅包含调用进程的MPI_Init()。因此,结果是在它们各自的MPI_COMM_WORLD实例中的许多MPI进程。

通常MPI_COMM_WORLDmpicc --showmewhich mpicc等命令可以帮助您确定是否确实如此。