BLAS Level 2中针对带状矩阵向量积的例程存在,包括一般情况和对称情况(MKL实现的链接)。
有没有办法使用多个向量(不使用外部for循环),以在这种情况下最大限度地提高性能?
答案 0 :(得分:1)
AFAIK答案是否定的。
可以在此处找到level3 BLAS子程序的完整列表
http://www.netlib.org/blas/#_level_3
并且没有带状矩阵子程序。
额外信息:如果你正在使用blas / lapack& C ++最近有一项设计C ++接口的计划:
http://www.netlib.org/na-digest-html/17/v17n21.html#1
(cblas和lapacke更适合C使用)
答案 1 :(得分:1)
我认为Spike library应该具有对称案例的例程。不过,我恐怕不能再提供任何帮助了,因为我从未使用它。
Spike(用于系统求解)的算法和实现在[Polizzi & Sameh, Comp. Fluids (36), 2007]中列出。