我不确定我是否正确理解MPI_Scatterv
应该做什么。我有79个项目来分散可变数量的节点。但是,当我使用MPI_Scatterv
命令时,我得到了荒谬的数字(好像我的接收缓冲区的数组元素未初始化)。以下是相关的代码段:
MPI_Init(&argc, &argv);
int id, procs;
MPI_Comm_rank(MPI_COMM_WORLD, &id);
MPI_Comm_size(MPI_COMM_WORLD, &procs);
//Assign each file a number and figure out how many files should be
//assigned to each node
int file_numbers[files.size()];
int send_counts[nodes] = {0};
int displacements[nodes] = {0};
for (int i = 0; i < files.size(); i++)
{
file_numbers[i] = i;
send_counts[i%nodes]++;
}
//figure out the displacements
int sum = 0;
for (int i = 0; i < nodes; i++)
{
displacements[i] = sum;
sum += send_counts[i];
}
//Create a receiving buffer
int *rec_buf = new int[79];
if (id == 0)
{
MPI_Scatterv(&file_numbers, send_counts, displacements, MPI_INT, rec_buf, 79, MPI_INT, 0, MPI_COMM_WORLD);
}
cout << "got here " << id << " checkpoint 1" << endl;
cout << id << ": " << rec_buf[0] << endl;
cout << "got here " << id << " checkpoint 2" << endl;
MPI_Barrier(MPI_COMM_WORLD);
free(rec_buf);
MPI_Finalize();
当我运行该代码时,我会收到此输出:
got here 1 checkpoint 1
1: -1168572184
got here 1 checkpoint 2
got here 2 checkpoint 1
2: 804847848
got here 2 checkpoint 2
got here 3 checkpoint 1
3: 1364787432
got here 3 checkpoint 2
got here 4 checkpoint 1
4: 903413992
got here 4 checkpoint 2
got here 0 checkpoint 1
0: 0
got here 0 checkpoint 2
我阅读了OpenMPI的文档并查看了一些代码示例,我不确定我错过了什么帮助会很棒!
答案 0 :(得分:5)
最常见的MPI错误之一再次发生:
if (id == 0) // <---- PROBLEM
{
MPI_Scatterv(&file_numbers, send_counts, displacements, MPI_INT,
rec_buf, 79, MPI_INT, 0, MPI_COMM_WORLD);
}
MPI_SCATTERV
是集体MPI操作。集合操作必须由指定的通信器中的所有进程执行才能成功完成。您只在0级执行它,这就是为什么只有它获得正确的值。
解决方案:删除条件if (...)
。
但这里还有另一个微妙的错误。由于集合操作不提供任何状态输出,因此MPI标准强制严格匹配发送到某个等级的元素的数量以及等级愿意接收的元素的数量。在您的情况下,接收方始终指定79
个元素,这些元素可能与send_counts
中的相应数字不匹配。你应该使用:
MPI_Scatterv(file_numbers, send_counts, displacements, MPI_INT,
rec_buf, send_counts[id], MPI_INT,
0, MPI_COMM_WORLD);
另请注意您的代码中存在以下差异,在此处发布问题时可能会出现拼写错误:
MPI_Comm_size(MPI_COMM_WORLD, &procs);
^^^^^
int send_counts[nodes] = {0};
^^^^^
int displacements[nodes] = {0};
^^^^^
当您获得procs
变量中的排名数时,其余代码中会使用nodes
。我想nodes
应该替换为procs
。