如何并行化矩阵转置?
我知道要转置矩阵我必须对此有所应用:
for (int i = 0; i < matrix.length - 1; i++) {
for (int j = i + 1; j < matrix[i].length; j++) {
tmp = matrix[i][j];
matrix[i][j] = matrix[j][i];
matrix[j][i] = tmp;
}
}
但是如何并行化这个操作,我不知道。
我需要创建N个线程来转置矩阵4n x 4n。
答案 0 :(得分:8)
由于这听起来像是一个家庭作业问题,我不会直接给你答案,但我会指出你正确的方向。
假设您正在转换4x4矩阵:
A B C D A E I M
E F G H -> B F J N
I J K L C G K O
M N O P D H L P
如果我们将其分解为四个子矩阵:
A B | C D A E | I M
E F | G H B F | J N
----+---- -> ----+----
I J | K L C G | K O
M N | O P D H | L P
请注意,生成的四个子矩阵都是您开始使用的四个子矩阵(交换了右上角和左下角矩阵)。你怎么能利用这个? :)
答案 1 :(得分:2)
我发现通常更好地携带一个“转置”标志(bool,bit,无论如何)并使用它来反转索引计算。这似乎是BLAS,LAPACK等的方式。
由于缓存争用,这里很难获得更多的并行加速。
答案 2 :(得分:0)
如果您想要一个简单的并行解决方案,那么类似的事情可能会起作用。
double[][] matrix=new double[numberOfRows][numberOfColumns];
double[][] transpose = new double[numberOfColumns][numberOfRows];
IntStream.range(0, numberOfColumns * numberOfRows).parallel().forEach(i ->
{
int m = i / numberOfRows;
int n = i % numberOfRows;
transpose[m][n] = matrix[n][m];
});
这使用一个并行的IntStream,您可以将其视为并行化的for循环,该循环针对矩阵中的元素数量运行。注意,我分配了两个变量来获取换位需要的实际行和列。
将流当前所处的索引i除以行数即可得到转置矩阵中目标行的索引。索引i的模和行数为您提供了应分配的转置矩阵的列。