所以我一直试图让openmpi在两台主机上工作,每当我输入我的命令时它就会挂起。使用调试我设法看到本机服务器在/ tmp命令之后成功执行了mpi,但是host2挂起了。
$ mpirun --prefix / usr / lib / openmpi -d -host server10 hello
[server9:09833] procdir:/ tmp / openmpi-sessions-jonesi1 @ server9_0 / 58918/0/0
[server9:09833] jobdir:/ tmp / openmpi-sessions-jonesi1 @ server9_0 / 58918/0
[server9:09833] top:openmpi-sessions-jonesi1 @ server9_0
[server9:09833] tmp:/ tmp
[server9:09833] mpirun:reset PATH:/usr/lib/openmpi/bin:/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr / local / sbin:/ usr / sbin:/ sbin:/ usr / lib64 / openmpi / bin:/ home / [我的用户名] / bin
[server9:09833] mpirun:reset LD_LIBRARY_PATH:/ usr / lib / openmpi / lib:/ usr / lib64 / openmpi / lib
[server10:01982] procdir:/ tmp / openmpi-sessions-jonesi1 @ server10_0 / 58918/0/1
[server10:01982] jobdir:/ tmp / openmpi-sessions-jonesi1 @ server10_0 / 58918/0
[server10:01982] top:openmpi-sessions-jonesi1 @ server10_0
[server10:01982] tmp:/ tmp
我见过很多人建议ssh可能被阻止,但是命令ssh server10 mpirun hello工作正常。有没有人对如何进行有任何建议?提前感谢您提供任何帮助。
答案 0 :(得分:1)
检查两台计算机上的防火墙是否已关闭。在Linux上,您可以使用
执行此操作iptables -L
SSH可能会起作用,因为防火墙会允许它,但MPI将需要一个可以被阻止的不同(高)端口。