这个问题可能过于宽泛,无法在此给出一个好的答案,特别是因为答案会随着时间的推移而改变。
总的来说,有许多容错工作正在进行,各种MPI实现都处于不同的支持状态。
- FT-MPI是一个不再开发的旧项目,但在MPI库中的集成FT方面有所启动。
- ULFM是FT-MPI的精神继承者,目前被提议包含在未来的MPI标准中,这意味着最终每个MPI实现都将提供它(如果它被接受)。目前正在Open MPI的旧分支中实现,并且MPICH中的实现目前正在进行中。
还有许多其他MPI库在MPI之上实现某种形式的容错,或者对实现本身进行某种调整。这些只是几个选项。