我想使用MPI和Pthreads实现以下功能但面临一些错误:
每个处理器将有2个线程。每个处理器的一个线程将向其他处理器发送数据,另一个线程将从其他处理器接收数据。当我实现它时,它会给出一些分段错误错误,例如“当前字节-40,总字节数0,远程id 5”。
仅用于测试目的,当我每个处理器只使用一个线程并且发送或接收数据时,则不会发生错误。
我找到了信息“通常,如果多个线程进行MPI调用,可能会出现问题。程序可能会失败或出现意外行为。如果MPI调用必须在一个线程中进行,则它们只能由一个线程进行。 “在以下链接中:https://computing.llnl.gov/tutorials/pthreads/
我想在每个处理器中使用两个线程,其中一个线程将使用MPI_Send函数发送一些数据,另一个线程将接收MPI_Recv函数以接收数据而不使用任何锁定机制。有没有人知道如何实现这个或如何使用多个线程来调用MPI函数而不使用互斥锁或锁定机制?
以下是代码:
int rank, size, msg_num;
// thread function for sending messages
void *Send_Func_For_Thread(void *arg)
{
int send, procnum, x;
send = rank;
for(x=0; x < msg_num; x++)
{
procnum = rand()%size;
if(procnum != rank)
MPI_Send(&send, 1, MPI_INT, procnum, 0, MPI_COMM_WORLD);
}
// sending special message to other processors with tag = 128 to signal the finishing of sending message
for (x = 0; x < size; x++)
{
if(x != rank)
MPI_Send(&send, 1, MPI_INT, x, 128, MPI_COMM_WORLD);
}
pthread_exit((void *)NULL);
}
// thread function for receiving messages
void *Recv_Func_For_Thread(void *arg)
{
MPI_Status status;
int recv, counter = 0;
while(counter != size - 1)
{
MPI_Recv(&recv, 1, MPI_INT, MPI_ANY_SOURCE, MPI_ANY_TAG, MPI_COMM_WORLD, &status);
if(status.MPI_TAG == 128)
counter++;
}
pthread_exit((void *)NULL);
}
int main(int argc, char **argv)
{
void *stat;
pthread_attr_t attr;
pthread_t thread[2];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &rank); // rank -> rank of this processor
MPI_Comm_size(MPI_COMM_WORLD, &size); // size -> total number of processors
srand((unsigned)time(NULL));
msg_num = atoi(argv[1]);
pthread_attr_init(&attr);
pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_JOINABLE);
// thread 0 will be sending messages
pthread_create(&thread[0], &attr, Send_Func_For_Thread, (void *)0);
// thread 1 will be receiving messages
pthread_create(&thread[1], &attr, Recv_Func_For_Thread, (void *)1);
pthread_attr_destroy(&attr);
pthread_join(thread[0], &stat);
pthread_join(thread[1], &stat);
cout << "Finished : Proc " << rank << "\n";
MPI_Finalize();
pthread_exit((void *)NULL);
return 0;
}
Compile:
========
module load mvapich2/gcc; mpicxx -lpthread -o demo demo.cpp
Run:
====
mpiexec -comm mpich2-pmi demo 10000000
I ran this program with 3 processors and got segmentation fault.
答案 0 :(得分:2)
(由于您没有提供示例,以下只是推测。)
您必须使用MPI_Init_thread()而不是MPI_Init()初始化MPI。如果我正确理解您的解释,“required”参数必须具有值MPI_THREAD_MULTIPLE。如果MPI_Init_thread()然后在“provided”参数中返回较低级别的线程支持,则意味着您的MPI实现不支持MPI_THREAD_MULTIPLE;在这种情况下,你必须做其他事情。请参阅http://www.mpi-forum.org/docs/mpi-20-html/node165.htm。
答案 1 :(得分:1)
只使用MPICH2进行一次换行。
请使用以下行代替使用MPI_Init:
int provided;
MPI_Init_thread(&argc, &argv, MPI_THREAD_MULTIPLE, &provided);
感谢各位的帮助并及时回复!