标签: cuda
是否可以通过仅调用cublasSgemm或者每行必须使用cublasSscal?
// A[m * k] B[k * n] // | 1 | | 7 1 4 7 | | 7 1 4 7| // | 2 | * | 8 2 5 8 | = |16 4 10 16| // | 3 | | 9 3 6 9 | |27 9 18 27|
答案 0 :(得分:1)
CUBLAS(或标准BLAS)中没有Hadamard product或广播,并且gemm不能按您要求的方式使用。