MPICH和OpenMPI中的错误处理程序

时间:2011-04-26 01:13:12

标签: mpi openmpi mpich

除了MPI_ERROR_RETURN和MPI_ERRORS_ARE_FATAL之外,OpenMPI和MPICH中是否有任何错误处理程序?哪种实现更好地处理错误? 请提供有关相同信息的更多信息的链接。

1 个答案:

答案 0 :(得分:1)

不,这是当前标准定义的唯一两个错误处理程序。

MPI forum目前正在研究将成为MPI-3的内容,错误处理和容错将成为新标准的重要组成部分(专门针对该主题的working group)。但是,在完成该工作之前,从MPI中获得更强的容错能力的唯一方法是使用早期的非标准扩展。 FT-MPI是一个开发了非常强大的MPI的项目,但不幸的是它基于MPI1.2;该标准的早期版本。有MPICH-V,基于MPI2,但更基于检查点重启。

对于检查点重启,OpenMPIMPICH2都支持BLCR,这是一种透明的检查点重启形式的容错功能,可以轻松回滚到最后一个检查点。硬件或网络故障的情况。