我正在尝试使用MPI中的行分区技术对4x4矩阵执行矩阵转置。
我有两个矩阵。 矩阵A 具有输入矩阵,就像在矩阵B中一样,我必须在转置后保存结果矩阵。
我正在执行以下步骤,
gdcmconv --raw compressed.dcm uncompressed.dcm
尽管如此,除了我的最后一次聚集电话,一切都正常。我正在4个过程中执行我的结果。最终结果与输入矩阵相同。我可能想对Bpart的每一行分别使用collect,但是我需要如何实现的帮助。下面是我的代码,
1.) Initializing Apart[N/P][N] (To partition rows of Matrix A among P processes)
2.) Initializing Bpart[N][N/p] (To partition Column of Matrix B among P processes)
3.) Computation (Bpart[i][j]=Apart[j][i])
4.) Gather the result in process 0.