使用ThreadPool进行矩阵乘法的并行化

时间:2015-03-24 17:53:09

标签: java multithreading matrix threadpool

我正在尝试并行矩阵乘法。

我通过在单独的线程中计算Matrix C的每个单元格来实现并行化。 (我希望我做得正确)。

我的问题是,如果使用线程池是创建线程的最佳方式。 (对不起,我不熟悉这个,有人建议这样做)

与此相比,我还会看到使用顺序版本的程序计算所需的时间差异很大吗?

import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;

public class ParallelMatrix {

public final static int N = 2000; //Random size of matrix
public static void main(String[] args) throws InterruptedException {

    long startTime = System.currentTimeMillis();

    //Create and multiply matrix of random size N.   
    double [][] a = new double [N][N];
    double [][] b = new double [N][N];
    double [][] c = new double [N][N];

    int i,j,k;

    for(i = 0; i < N ; i++) {
        for(j = 0; j < N ; j++){
            a[i][j] = i + j;
            b[i][j] = i * j;
        }

        ExecutorService pool = Executors.newFixedThreadPool(1);
        for(i = 0; i < N; i++) {
            for(j = 0; j < N; j++) {  
                pool.submit(new Multi(N,i,j,a,b,c));
            }
        }
        pool.shutdown();
        pool.awaitTermination(1, TimeUnit.DAYS);
        long endTime = System.currentTimeMillis();
        System.out.println("Calculation completed in " +
             (endTime - startTime) + " milliseconds");

    }
    static class Multi implements Runnable {
        final int N;
        final double [][] a;
        final double [][] b;
        final double [][] c;
        final int i;
        final int j;

        public Multi(int N, int i, int j, double[][] a, double[][] b, double[][] c){
            this.N=N;
            this.i=i;
            this.j=j;
            this.a=a;
            this.b=b;
            this.c=c;
        }

        @Override
        public void run() {
            for(int k = 0; k < N; k++) 
                c[i][j] += a[i][k] * b[k][j];
        }
    }
}

1 个答案:

答案 0 :(得分:2)

您必须在调度开销,操作持续时间和可用内核数量之间取得平衡。首先,根据可用核心数newFixedThreadPool(Runtime.getRuntime().availableProcessors())调整线程池的大小。

为了最大程度地减少调度开销,您希望将操作切片为与处理器一样多的独立任务(理想情况下执行时间相同)。

通常,您在切片中执行的操作越小,您的调度开销就越多。你现在拥有的(N平方任务)有过多的开销(你将创建并提交2000次2000多次运行,每次运行都很少)。