MPI矩阵乘法

时间:2018-03-29 19:38:14

标签: c parallel-processing mpi

我正在尝试制作一个MPI矩阵乘法程序,但分散函数似乎对我不起作用。只有一行分散,其余核心都有垃圾值。

同样在我调用display_matrix()函数之前,我MPI_Init()似乎正在运行4个线程而不是1个(我有四核CPU)。为什么在初始化之前就会发生这种情况?

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#include<mpi.h>

int **matrix_generator(int row,int col);
int **multiply_matrices(int **matrix_A,int **matrix_B,int rowsA, int colsA,int rowsB,int colsB);
void display_matrix(int **matrixA,int rows,int cols);

void main(int argc,char *argv[])
{
    srand(time(0));

    int **matrix_A,**matrix_B,**matrix_result,*scattered_matrix,*gathered_matrix, rowsA,colsA,rowsB,colsB,world_rank,world_size,i,j;

    rowsA = atoi(argv[1]);
    colsA = atoi(argv[2]);
    rowsB = atoi(argv[3]);
    colsB = atoi(argv[4]);

    scattered_matrix = (int *)malloc(sizeof(int) * rowsA*colsA/4); 

    if (argc != 5)
    {
        fprintf(stderr,"Usage: mpirun -np <No. of processors> ./a.out <Rows A> <Columns A> <Rows B> <Columns B>\n");
        exit(-1);
    }
    else if(colsA != rowsB)
    {
        printf("Check the dimensions of the matrices!\n\n");
    }

    matrix_A = matrix_generator(rowsA,colsA);
    matrix_B = matrix_generator(rowsB,colsB);

    display_matrix(matrix_A,rowsA,colsA);

    MPI_Init(&argc, &argv);

    MPI_Comm_rank(MPI_COMM_WORLD, &world_rank);
    MPI_Comm_size(MPI_COMM_WORLD, &world_size);

    MPI_Scatter(matrix_A, rowsA*colsA/4, MPI_INT, scattered_matrix, rowsA*colsA/4, MPI_INT, 0, MPI_COMM_WORLD);

    for(i=0;i<world_size;i++)
    {  
        printf("Scattering data %d from root to: %d \n",scattered_matrix[i],world_rank);
    }

    MPI_Barrier(MPI_COMM_WORLD);

    MPI_Finalize();
}

int **matrix_generator(int row, int col)
{
    int i, j, **intMatrix;

    intMatrix = (int **)malloc(sizeof(int *) * row); 

    for (i = 0; i < row; i++)
    {
        intMatrix[i] = (int *)malloc(sizeof(int *) * col);
        for (j = 0;j<col;j++)
        {
            intMatrix[i][j]=rand()%10;
        }
    }
    return intMatrix;
}

void display_matrix(int **matrix, int rows,int cols)
{
    int i,j;
    for (i = 0; i < rows; i = i + 1)
    {
        for (j = 0; j < cols; j = j + 1)
            printf("%d ",matrix[i][j]);
        printf("\n");
    }
}

1 个答案:

答案 0 :(得分:0)

主要问题是你的矩阵没有分配在连续的内存中(参见评论部分的链接)

MPI标准未指定应用调用MPI_Init()之前发生的情况。

两个主要的MPI实现选择在调用mpirun时生成所有任务(这意味着首先有4个独立进程,并且当它们都调用{{1}时它们“加入”单个MPI作业})。 话虽如此,曾经有一家供应商选择MPI_Init()启动一个MPI任务,并在调用mpirun时使用自己的远程分支。

最重要的是,如果你想编写可移植代码,请在调用MPI_Init()之前尽可能少地做(并且永远不要打印任何东西)。