标签: cuda blas cublas
问题很简单,我在c ++中得到了两个行主要的数组,假设它们是A [3,2],B [4,2],所以A * B_trans = C [3,4]。但是,如何调用cublasSgemm函数计算矩阵C呢?我知道cublas假定数组是主要列存储。如何正确设置m,n,k,lda,ldb,ldc?
同时,如果我希望C数组是行主要的,以便在下一个过程中易于使用,则公式应为:C_trans = B * A_trans
我对吗?
谢谢!