MPI处理通信错误

时间:2015-06-09 13:33:25

标签: raspberry-pi mpi

我有一个有三个节点的覆盆子pi集群。我已经安装了mpi,我试图执行一个名为cpi的示例代码。问题是我收到了这个错误:

在主节点上执行的命令:

mpiexec -f machinefile -n 2 mpi-build/examples/cpi 

结果:

Process 0 of 2 is on Pi01
Fatal error in PMPI_Reduce: A process has failed, 
error stack:PMPI_Reduce(1259)...............:MPI_Reduce(sbuf=0xbebc6630,rbuf=0xbebc6638,count=1, MPI_DOUBLE, MPI_SUM, root=0, MPI_COMM_WORLD) failed
MPIR_Reduce_impl(1071)..........:
MPIR_Reduce_intra(877)..........:
MPIR_Reduce_binomial(184).......:
MPIDI_CH3U_Recvq_FDU_or_AEP(630): Communication error with rank 1
Process 1 of 2 is on Pi02

我在主设备和每个从设备之间使用了SSH Keygens,因此无需使用密码在每个节点之间登录。 (但是如果一个从站连接到另一个,它必须使用密码登录到另一个从站,这意味着我没有在从站之间共享ssh密钥,而只在主站和从站之间共享。)

使用流程级别打印helloworld的程序和执行它的PC正常工作,但是当进程需要与另一个进程通信时,我会收到上述错误。 我该怎么办?

0 个答案:

没有答案