我试图启动我的MPI群集。我在每个节点上都使用sudo ufw disable
禁用了防火墙。我已经设置了无密码连接,以便pc0可以通过ssh无密码连接pc1和pc2。
ub0是主节点主机,ub1和ub2是从节点。
错误是:
pc0@ub0:~/Downloads/mpich-3.0.4/examples$ mpirun -n 10 -f servers ./cpi
[proxy:0:1@ub1] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:1@ub1] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)
[proxy:0:2@ub2] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:2@ub2] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)
服务器文件是:
ub0:2
pc1@ub1:2
pc2@ub2:2
我的操作系统是Ubuntu 14.04 i386。 MPI是MPICH
现在,我不知道如何修复它。谢谢你的帮助!
答案 0 :(得分:0)
我没有在其他节点上的/etc/hosts
添加IP和主机名。
所以编辑/etc/hosts
,并添加ip和hostname,如下所示:
192.168.0.1 node1
192.168.0.2 node2
192.168.0.3 node3
之后,将编译后的文件复制到其他节点中的相应目录。然后它会正常工作。