标签: mpi openmpi mpich
除了MPI_ERROR_RETURN和MPI_ERRORS_ARE_FATAL之外,OpenMPI和MPICH中是否有任何错误处理程序?哪种实现更好地处理错误? 请提供有关相同信息的更多信息的链接。
答案 0 :(得分:1)
不,这是当前标准定义的唯一两个错误处理程序。
MPI forum目前正在研究将成为MPI-3的内容,错误处理和容错将成为新标准的重要组成部分(专门针对该主题的working group)。但是,在完成该工作之前,从MPI中获得更强的容错能力的唯一方法是使用早期的非标准扩展。 FT-MPI是一个开发了非常强大的MPI的项目,但不幸的是它基于MPI1.2;该标准的早期版本。有MPICH-V,基于MPI2,但更基于检查点重启。
对于检查点重启,OpenMPI和MPICH2都支持BLCR,这是一种透明的检查点重启形式的容错功能,可以轻松回滚到最后一个检查点。硬件或网络故障的情况。