标签: cuda blas sparse-matrix
我想使用cuSPARSE csrmm函数来乘以两个矩阵。 A矩阵是稀疏的,B矩阵是密集的。密集矩阵是行主格式。是否有一些很好的方法(技巧)来完成这个而不需要明确地转置B?我正在考虑类似于this的密集BLAS。
cuSPARSE csrmm
由于