如何并行化矩阵转置?

时间:2013-05-31 20:47:56

标签: java multithreading

如何并行化矩阵转置?

我知道要转置矩阵我必须对此有所应用:

for (int i = 0; i < matrix.length - 1; i++) {
    for (int j = i + 1; j < matrix[i].length; j++) {
        tmp = matrix[i][j];
        matrix[i][j] = matrix[j][i];
        matrix[j][i] = tmp;
    }
}

但是如何并行化这个操作,我不知道。

我需要创建N个线程来转置矩阵4n x 4n。

3 个答案:

答案 0 :(得分:8)

由于这听起来像是一个家庭作业问题,我不会直接给你答案,但我会指出你正确的方向。

假设您正在转换4x4矩阵:

A B C D      A E I M
E F G H  ->  B F J N
I J K L      C G K O
M N O P      D H L P

如果我们将其分解为四个子矩阵:

A B | C D      A E | I M
E F | G H      B F | J N
----+----  ->  ----+----
I J | K L      C G | K O
M N | O P      D H | L P

请注意,生成的四个子矩阵都是您开始使用的四个子矩阵(交换了右上角和左下角矩阵)。你怎么能利用这个? :)

答案 1 :(得分:2)

我发现通常更好地携带一个“转置”标志(bool,bit,无论如何)并使用它来反转索引计算。这似乎是BLAS,LAPACK等的方式。

由于缓存争用,这里很难获得更多的并行加速。

答案 2 :(得分:0)

如果您想要一个简单的并行解决方案,那么类似的事情可能会起作用。

double[][] matrix=new double[numberOfRows][numberOfColumns];
double[][] transpose = new double[numberOfColumns][numberOfRows];
IntStream.range(0, numberOfColumns * numberOfRows).parallel().forEach(i ->
{
    int m = i / numberOfRows;
    int n = i % numberOfRows;
    transpose[m][n] = matrix[n][m];
});

这使用一个并行的IntStream,您可以将其视为并行化的for循环,该循环针对矩阵中的元素数量运行。注意,我分配了两个变量来获取换位需要的实际行和列。

将流当前所处的索引i除以行数即可得到转置矩阵中目标行的索引。索引i的模和行数为您提供了应分配的转置矩阵的列。