我有一个大小 1000万×1000 的大矩阵,我想用正方形 1000×1000 矩阵来计算它的乘法结果。
目前,3级BLAS提供*trmm
函数,这些函数允许我们在乘法期间覆盖输入矩阵,但仅当其中一个输入矩阵是三角形时。当输入矩阵是一般方形矩阵而不是三角形时,似乎没有任何这样的3级功能。
现在进行我的inplace矩阵乘法,我可以对矩阵向量乘法进行10Million 2级BLAS调用,或者我可以对A进行LU分解,然后对*trmm
进行两次3级BLAS调用。我有兴趣讨论是否存在我忽略的第三种解决方案。