BLAS 2级带矩阵 - 矢量积多个向量

时间:2017-08-26 15:54:28

标签: c++ c vector blas intel-mkl

BLAS Level 2中针对带状矩阵向量积的例程存在,包括一般情况和对称情况(MKL实现的链接)。

cblas_?gbmv

cblas_?sbmv

有没有办法使用多个向量(不使用外部for循环),以在这种情况下最大限度地提高性能?

2 个答案:

答案 0 :(得分:1)

AFAIK答案是否定的。

可以在此处找到level3 BLAS子程序的完整列表

http://www.netlib.org/blas/#_level_3

并且没有带状矩阵子程序。

额外信息:如果你正在使用blas / lapack& C ++最近有一项设计C ++接口的计划:

http://www.netlib.org/na-digest-html/17/v17n21.html#1

(cblas和lapacke更适合C使用)

答案 1 :(得分:1)

我认为Spike library应该具有对称案例的例程。不过,我恐怕不能再提供任何帮助了,因为我从未使用它。

Spike(用于系统求解)的算法和实现在[Polizzi & Sameh, Comp. Fluids (36), 2007]中列出。