OpenMPI:SGE群集上的主机密钥验证失败

时间:2019-01-31 21:42:32

标签: openmpi hpc

我最近在SGE群集上安装了OpenMPI 2.0版。但是,当我提交工作时,我得到“主机ket验证失败”。即使我可以不用提交主机的密码登录到该节点(compute10)。

输出文件中的错误:

  

警告:无法访问tty(错误文件描述符)。因此没有工作控制   在这个外壳中。 2019年1月30日星期三15:58:53 EST 主机密钥验证   失败了[文件orca_main / gtoint.cpp,第137行]:ORCA错误完成   ORCA_GTOInt中的终止

我的SGE脚本如下:

  

!/ bin / tcsh

     

$ -q sge-queue @ compute10

     

$ -pe mpi 8

     

$ -V

     

$ -cwd

     

$ -j y

     

$ -l h_vmem = 64G

     

日期

     

setenv OMP_NUM_THREADS 8

     

/ home / user / orca_4_0_1_1_linux_x86-64_openmpi202 / orca ccl3.inp>   ccl3.out

     

日期

和我的并行环境 mpi

  

pe_name mpi

     

插槽999

     

user_lists NONE

     

xuser_lists NONE

     

start_proc_args /export/sge6.2_U7/mpi/startmpi.sh -catch_rsh   $ pe_hostfile

     

stop_proc_args /export/sge6.2_U7/mpi/stopmpi.sh

     

allocation_rule $ pe_slots

     

control_slaves是

     

job_is_first_task为假

     

urgency_slots分钟

     

accounting_summary为真

1 个答案:

答案 0 :(得分:0)

尝试各种方法后,将OpenMPI更新到3.1.0版本并使用以下选项进行构建可以解决此问题。

  

./ configure --prefix = / usr / local --with-sge   -默认启用--orterun-prefix