标签: fortran blas
我在Fortran 77中整理了一些科学代码,我正在讨论什么会更快。
基本上,我有一个MxN矩阵,我们称它为A. M大于N.后来在代码中,我需要将一堆向量乘以(A)。
我的问题是,采取A,自己转置并存储它会更快,或者当我调用BLAS时,只需给它转置标志?
谢谢! -Patrick
答案 0 :(得分:6)
我的直觉告诉我使用转置标志。 在这种情况下,你会大量使用一个点积。
实际上,在没有实际运行代码的情况下很难分辨。 现代blas采用缓存阻塞技术,这使得简单的分析最多是困难的。