我有一段MPI C代码,如下所示:
for(i=0;i<NTask;i++)
{
got_initial_bit_of_data[i]=0;
if(need_to_communicate with i)
MPI_ISend(&bit_of_pre_data_for_i,1,MPI_INT,partner,0,MPI_COMM_WORLD,&pre_requests[i]);
}
while(1)
{
MPI_Testsome(NTask,pre_requests,&ndone,idxs,MPI_STATUSES_IGNORE)
if(ndone)
{
for(i=0;i<ndone;i++)
{
MPI_ISend(&the_main_block_of_data_for_i,size_of_block,MPI_BYTE,idxs[i],1,MPI_COMM_WORLD,&main_requests[idxs[i]]);
}
}
//Other stuff that doesn't matter
MPI_IProbe(MPI_ANY_SOURCE,0,MPI_COMM_WORLD,&flag,&status);
if(!flag)
{
MPI_IProbe(MPI_ANY_SOURCE,1,MPI_COMM_WORLD,&flag,&status);
}
if(flag)
{
//Receiving the initial little bit of data
if(status.MPI_TAG==0)
{
//Location 1
got_initial_bit_of_data[status.MPI_SOURCE]=1;
MPI_Recv(&useful_location,1,MPI_INT,status.MPI_SOURCE,MPI_STATUS_IGNORE);
}
//Receiving the main bit of data
else if(status.MPI_TAG==1)
{
//Location 2
if(got_initial_bit_of_data[status.MPI_SOURCE]!=1)
//Something has gone horribly wrong...
//Receive the main bit of data here...
}
}
}
显然我省略了很多细节,因为完整的代码长达数百行。如果我做的事情看起来有点奇怪,那可能是因为它是由于省略的代码块中的某些东西。
这个想法是,每个处理器在开始时向它想要与之通信的处理器发送“通知”消息。当它检测到这些处理器已收到此消息时(即当MPI_Testsome指示“声明”MPI_Isend完成时),它应发送大量数据。
从处理器接收数据的角度来看,它应首先在位置1接收通知消息,这将导致MPI_Testsome指示Isend已完成并发送大块数据。然后接收处理器应该在位置2接收主数据块。遵循这个逻辑,在got_initial_bit_of_data [status.MPI_SOURCE]为0的情况下到达位置2应该是不可能的,但这恰恰是偶尔会发生的事情而且我会喜欢找出原因。
要么我的代码逻辑错误,要么我缺少一些IProbe和Testsome的微妙。
我也正在退出并重新输入整个代码块,不同的处理器在不同的时间点进出,但只有当所有的ISends都被处理时(由Testsome确定它们是完成)。
如果上述解释没有任何意义,我想知道的是,在任何情况下,Testsome声称完成了一个ISend 没有匹配的接收完成(甚至开始) ?处理器调用IProbe是否足以导致Testsome考虑完成请求?
答案 0 :(得分:3)
如果上述解释没有任何意义,我想知道的是,在任何情况下,Testsome声称ISend完成而没有匹配的接收完成(甚至开始)?处理器调用IProbe是否足以导致Testsome考虑完成请求?
MPI_Testsome所保证的是MPI不再需要您从ISend使用的缓冲区。如果要保证收件人已启动接收,请使用同步表单ISSend。