启动MPI群集失败

时间:2016-03-17 12:38:11

标签: ssh mpi mpich

我试图启动我的MPI群集。我在每个节点上都使用sudo ufw disable禁用了防火墙。我已经设置了无密码连接,以便pc0可以通过ssh无密码连接pc1和pc2。

ub0是主节点主机,ub1和ub2是从节点。

错误是:

pc0@ub0:~/Downloads/mpich-3.0.4/examples$ mpirun -n 10 -f servers ./cpi
[proxy:0:1@ub1] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:1@ub1] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)
[proxy:0:2@ub2] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:2@ub2] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)

服务器文件是:

ub0:2
pc1@ub1:2
pc2@ub2:2

我的操作系统是Ubuntu 14.04 i386。 MPI是MPICH

现在,我不知道如何修复它。谢谢你的帮助!

1 个答案:

答案 0 :(得分:0)

我没有在其他节点上的/etc/hosts添加IP和主机名。

所以编辑/etc/hosts,并添加ip和hostname,如下所示:

192.168.0.1 node1
192.168.0.2 node2
192.168.0.3 node3

之后,将编译后的文件复制到其他节点中的相应目录。然后它会正常工作。