MPI的一个非常奇怪的行为

时间:2012-09-29 01:57:06

标签: mpi

使用MPI时我有一个非常奇怪的错误。无法删除成功创建的通信器。删除尝试会导致除通信器组中包含的节点之外的所有节点发生致命错误。最小的工作示例如下。您怎么看待这种奇怪行为的原因?

#include <stdio.h>
#include <mpi.h>

int main(int argc, char* argv[])
{
    MPI_Group group_world;              // group of MPI_COMM_WORLD
    MPI_Group group_new;                // new group
    MPI_Comm  comm_new;                 // new communicator 
    int group_new_ranks[3]={10,20,30};  // new communicator's ranks 

    MPI_Init(&argc, &argv);

    MPI_Comm_group(MPI_COMM_WORLD, &group_world);                 // get group_world - MPI_SUCCESS for all nodes
    MPI_Group_incl(group_world, 3, group_new_ranks, &group_new);  // get new group - MPI_SUCCESS for all nodes
    MPI_Comm_create(MPI_COMM_WORLD, group_new, &comm_new);        // create new communicator - MPI_SUCCESS for all nodes

    MPI_Comm_free(&comm_new);   // FATAL ERROR for all nodes except 10, 20, 30
    MPI_Group_free(&group_new);
    MPI_Group_free(&group_world);

    MPI_Finalize();
    return 0;
}

1 个答案:

答案 0 :(得分:3)

MPI_Comm_create()MPI_COMM_NULL返回给不在该组内的所有进程。您将MPI_COMM_NULL传递给MPI_Comm_free(),这是不允许的。