我搜索过很多网站和资源但是找不到使用PBLAS PDGEMM函数的并行矩阵乘法的任何C或FORTRAN代码示例,请你帮我找到这样的资源。
提前谢谢。
我有一个来自netlib网站的pblas.tar.gz的例子,做了make并使用mpi在Linux集群上执行了它,但程序在所有节点上执行相同的运行而不拆分矩阵。
答案 0 :(得分:0)
一个经典案例是ScaLAPACK软件和相关示例,例如http://www.netlib.org/scalapack/examples/example1.f
如果你误解了,PDGEMM不会“拆分矩阵”,它希望输入数据已经正确分配(即2D块循环分配)。