julia远程工作者使用“machinefile” - 错误:连接:主机无法访问(EHOSTUNREACH)

时间:2014-09-28 03:26:43

标签: julia

我正在尝试在julia中建立一个远程工作池以进行并行处理; “driver”机器运行Ubuntu 14.04,配置如下:

julia> versioninfo()
Julia Version 0.3.1
Commit c03f413 (2014-09-21 21:30 UTC)
Platform Info:
  System: Linux (x86_64-linux-gnu)
  CPU: Intel(R) Core(TM) i7-4770 CPU @ 3.40GHz
  WORD_SIZE: 64
  BLAS: libopenblas (NO_LAPACK NO_LAPACKE DYNAMIC_ARCH NO_AFFINITY Haswell)
  LAPACK: liblapack.so.3
  LIBM: libopenlibm
  LLVM: libLLVM-3.3

远程机器正在运行CentOS 7.0:

julia> versioninfo()
Julia Version 0.3.1
Platform Info:
  System: Linux (x86_64-redhat-linux)
  CPU: Intel(R) Core(TM) i7-3770 CPU @ 3.40GHz
  WORD_SIZE: 64
  BLAS: libopenblas (NO_LAPACKE DYNAMIC_ARCH NO_AFFINITY Sandybridge)
  LAPACK: libopenblasp.so.0
  LIBM: libopenlibm
  LLVM: libLLVM-3.3

我已经为无密码登录设置了SSH密钥(从命令行可以正常工作),但是当我尝试使用CentOS机器作为远程工作者启动julia时,我得到了这个:

corey@flash:~/rti_julia$ julia --machinefile machinefile 
ERROR: connect: host is unreachable (EHOSTUNREACH)
 in wait at ./task.jl:284
 in wait at ./task.jl:194
 in stream_wait at stream.jl:263
 in wait_connected at stream.jl:301
 in Worker at multi.jl:113
 in create_worker at multi.jl:1064
 in start_cluster_workers at multi.jl:1028
 in addprocs_internal at multi.jl:1234
 in addprocs at multi.jl:1244
 in process_options at ./client.jl:240
 in _start at ./client.jl:354
 in _start_3B_1714 at /usr/bin/../lib/x86_64-linux-gnu/julia/sys.so

corey@flash:~/rti_julia$ Master process (id 1) could not connect within 60.0 seconds.
exiting.

我在CentOS机器上检查了/ var / log / messages和/ var / log / secure,它确实显示SSH客户端连接成功。

我怀疑正在发生的是工作进程在远程计算机(CentOS)上启动,但由于某种原因Ubuntu计算机上的主进程无法连接到在CentOS计算机上生成的工作进程。 (因此我得到的状态消息:“主进程(id 1)无法在60.0秒内连接。退出。”)

关于这一点的奇怪部分是,如果我使用CentOS机器作为“主机”而Ubuntu机器作为远程工作者,一切正常。

我可以做些什么来使其工作来自Ubuntu机器?谢谢。

0 个答案:

没有答案