Cublas有元素乘法吗? 我正在尝试执行这些Matlab操作
x .* s
x ./ s
我有使用for循环和另一个CUDA的主机实现,但我想知道我是否错过了可以以优化的方式完成它的cublas库函数。
这是我的CUDA内核
__global__ void elementMul(double *A, double *B, double *C){
int i = threadIdx.x;
C[i] = A[i] * B[i];
}