我在具有2个节点的Raspberry Pi群集上安装了Torque 4.2.0。在服务器上安装Torque_server和torque_sched,在节点上安装torque_mom。我成功运行了qsub脚本,但是,在安装了“其他”mpiexec(如此处建议:http://www.cslu.ogi.edu/~zak/debianclusters/MPICH_with_Torque_Functionality)之后,如果我运行运行mpiexec的qsub脚本,我会收到以下错误:
socket_connect错误(验证trqauthd正在运行) 连接到trqauthd(-1)时出错 - [无法连接到socket_connec中的端口-1 t_addr - 错误号码:9错误的文件描述符] 与MasterCruz2通信时出错(172.20.45.225) mpiexec:错误:get_hosts:pbs_connect:没有错误。
我做了一些研究,但除了旧电子邮件之外什么也找不到。 任何帮助或想法?