例如,cublas<t>geam()
将执行:
但是,如果我想将结果存储在A
,该怎么办?我可以用指针*C = *A
来调用它,以便:
不用担心我可能会将输出写入仍然被读作输入的矩阵?
如果是这样,保证我们安全地执行所有其他CUBLAS矩阵操作吗?
答案 0 :(得分:3)
在您发布的文件中,答案是正确的,cublasgeam() - If C overlaps A or B, then behaviour is undefined
。
如果C == A
,Nvidia不保证这会有效。