输入矩阵是否也可用于存储CUBLAS的输出矩阵?

时间:2013-05-02 03:44:48

标签: c cuda gpgpu cublas

例如,cublas<t>geam()将执行:

C = αop(A) + βop(B)

但是,如果我想将结果存储在A ,该怎么办?我可以用指针*C = *A来调用它,以便:

A = αop(A) + βop(B)

不用担心我可能会将输出写入仍然被读作输入的矩阵?

如果是这样,保证我们安全地执行所有其他CUBLAS矩阵操作吗?

1 个答案:

答案 0 :(得分:3)

在您发布的文件中,答案是正确的,cublasgeam() - If C overlaps A or B, then behaviour is undefined。 如果C == A,Nvidia不保证这会有效。