mpiexec:无法启动所有触发器;可能包含无效的计算机名称

时间:2016-03-29 12:43:21

标签: parallel-processing mpi mpich

我是MPI和MPICH的新手。

我在两台机器上安装了mpich:Ubuntu 10.04.2 LTS。

mpicc -v的版本为1.2.1p1。

我已在/ etc / hosts中为两台计算机中的客户端和主服务器添加了条目。

为无密码远程ssh添加了SSH配置。

运行命令时:

  

mpiexec -np 3 -host master ./a.out:-np 3 -host客户端./a.out

系统以

响应
  

mpiexec:无法启动所有触发器;可能包含无效的机器名称

     

剩余的指定主机:

     

107.109.110.219(主)

     

107.108.87.33(客户)

请您提出建议,如果出现问题。

2 个答案:

答案 0 :(得分:0)

您还需要为MPI实现指定主机文件。对于OpenMPI,您可以查看以下页面:

https://www.open-mpi.org/faq/?category=running#mpirun-hostfile

这里描述了如何设置它。我已将OpenMPI链接起来,因为它更清晰。在这里,您可以找到使用MPICH的教程,并解释如何设置主机文件:

http://mpitutorial.com/tutorials/mpi-hello-world/

答案 1 :(得分:0)

我最初是通过apt-get安装了mpich。我认为这引起了陈述的问题。

修复我做了以下操作并修复了问题:

  1. 卸载了通过apt-get安装的mpich。
  2. 按照mpich用户指南的步骤下载并编译mpich v3.2源代码。
  3. 在此之后,其中一台机器出现了缺少libudev.so.0的问题,作为临时解决方案,安装了libudev.so.1和软链接的libudev.so.0。
  4. 经过这3个步骤后,mpiexec正在为机器正常运行。