在BLAS中移植还是先自己做?

时间:2010-09-14 03:20:43

标签: fortran blas

我在Fortran 77中整理了一些科学代码,我正在讨论什么会更快。

基本上,我有一个MxN矩阵,我们称它为A. M大于N.后来在代码中,我需要将一堆向量乘以(A)。

我的问题是,采取A,自己转置并存储它会更快,或者当我调用BLAS时,只需给它转置标志?

谢谢! -Patrick

1 个答案:

答案 0 :(得分:6)

我的直觉告诉我使用转置标志。 在这种情况下,你会大量使用一个点积。

实际上,在没有实际运行代码的情况下很难分辨。 现代blas采用缓存阻塞技术,这使得简单的分析最多是困难的。