使用MPI时我有一个非常奇怪的错误。无法删除成功创建的通信器。删除尝试会导致除通信器组中包含的节点之外的所有节点发生致命错误。最小的工作示例如下。您怎么看待这种奇怪行为的原因?
#include <stdio.h>
#include <mpi.h>
int main(int argc, char* argv[])
{
MPI_Group group_world; // group of MPI_COMM_WORLD
MPI_Group group_new; // new group
MPI_Comm comm_new; // new communicator
int group_new_ranks[3]={10,20,30}; // new communicator's ranks
MPI_Init(&argc, &argv);
MPI_Comm_group(MPI_COMM_WORLD, &group_world); // get group_world - MPI_SUCCESS for all nodes
MPI_Group_incl(group_world, 3, group_new_ranks, &group_new); // get new group - MPI_SUCCESS for all nodes
MPI_Comm_create(MPI_COMM_WORLD, group_new, &comm_new); // create new communicator - MPI_SUCCESS for all nodes
MPI_Comm_free(&comm_new); // FATAL ERROR for all nodes except 10, 20, 30
MPI_Group_free(&group_new);
MPI_Group_free(&group_world);
MPI_Finalize();
return 0;
}
答案 0 :(得分:3)
MPI_Comm_create()
将MPI_COMM_NULL
返回给不在该组内的所有进程。您将MPI_COMM_NULL
传递给MPI_Comm_free()
,这是不允许的。