标签: sparse-matrix linear-algebra eigen intel-mkl cublas
BSR格式显然适用于块稀疏的矩阵,并且使用BSR格式时,对于此类矩阵,SPMV或SPMM操作比CSR格式更快。我很好奇这种速度从何而来。 BSR格式的内存访问模式是否更好?如果是这样,怎么办?
简而言之,我想特别了解在使用块备用矩阵时BSR算法为何胜过CSR算法。