根据MPI标准,可能会使用MPI_Cart_create例程的重新排序参数“可能选择将虚拟拓扑嵌入到 物理机“。然而,我无法找到有关如何在OpenMPI或MPICH中执行此操作的任何信息。 任何人都可以解释一下这种重新排序是如何发生的,以及它是否真的在任何MPI实现中提供了优化的虚拟拓扑?
答案 0 :(得分:1)
拓扑感知通信器可以通过很多方式提高性能,但实际上,没有实现这样做(正如Jeff在评论中所说)。
理论上,实现可以执行诸如排列等级以使得在物理拓扑中接近的进程(例如在相同的套接字/节点/机架/等中)也将在等级上接近的情况。这样可以缩短通信时间,因为您可以减少跳数与最常联系的排名进行通信。