我们无法在拥有3台以上计算机的Open MPI群集中运行程序。
如果我们跑:
mpirun --host master,slave5,slave3 ./cluster
它有效。
如果我们跑:
mpirun --host master,slave4,slave3,slave5 ./cluster
我们收到以下错误:
ssh: Could not resolve hostname slave5: Temporary failure in name resolution
尽管它看起来像名称解析错误,但事实并非如此,因为slave5可以处理第一个命令。
到目前为止,我们已经看到其他人报告相同的错误而没有任何解决方案。例如:
有什么想法吗?