为什么我的所有Open MPI进程都排在0位?

时间:2010-10-28 03:56:13

标签: macos openmpi homebrew

我正在使用Open MPI编写并行程序。我正在运行Snow Leopard 10.6.4,我通过homebrew包管理器安装了Open MPI

当我使用mpirun -np 8 ./test运行我的程序时,每个进程报告它的排名为0,并且认为进程总数为1,并且8行process rank: 0, total processes: 1被吐出到控制台

我知道这不是代码问题,因为完全相同的代码将在我学院的计算机实验室的某些Ubuntu机器上按预期编译和运行。我查看了自制软件的bug跟踪器,没有人报告Open MPI软件包存在问题。我很茫然。

4 个答案:

答案 0 :(得分:6)

检查您正在调用的mpirun。正在执行的mpirun正在启动二进制的8个独立实例。因此,每个实例都是一个Universe大小为1且排名为0的MPI应用程序。

此外,除非您计划在OS X框的集群上运行最终代码,否则我强烈建议您在VM中安装Linux版本(如virtualbox)以进行测试和测试。制定这些准则。

答案 1 :(得分:6)

完全卸载以前的MPI实施。

在我的情况下,我首先安装了MPICH2,然后将其卸载,并更改为OpenMPI。然后同样的情况发生了,所有进程的排名都是0.我为解决这个问题做了什么:从我的系统中完全卸载MPICH2(我使用的是Ubuntu / Debian Linux)。

# apt-get remove mpich2
# apt-get autoremove

答案 2 :(得分:2)

我在Linux上的C语言中遇到了与openMPI相同的问题。使用MPIch2代替,问题得到解决(但记得在最后运行MPI_Finalize()或者它变得很奇怪。)

答案 3 :(得分:2)

今天我遇到了和你一样的问题。最后我得到了解决方案。

请参阅https://wiki.mpich.org/mpich/index.php/Frequently_Asked_Questions#Q:_All_my_processes_get_rank_0

简单来说,答案是,MPI需要合适的PMI来告诉流程他们的等级和其他内容。因此,我们需要使用相应的mpirun / mpiexec来运行MPI程序。

我猜你的问题与mpi程序编译器和mpirun工具之间的不匹配有关。所以尝试卸载所有,并安装MPICH / openMPI(确保只安装其中一个)。