给定矩阵 A 1 ,...,A n 和 B 1 , ...,B n 存储为gpuArray
,我想计算矩阵 C i = A i < /子> * B <子> I 子> 的
所有 A i 的大小相同,且所有 B i & #39; s具有相同(可能不同)的大小。
如果 n 非常大并且矩阵的大小相对较小,我如何在GPU上快速完成此操作?是否可以避免使用CUDA?
答案 0 :(得分:2)
如果你有MATLAB R2013b,你可以使用新的gpuArray pagefun
函数。
答案 1 :(得分:1)
如果A
和B
属于gpuArray
类,则操作C = A*B
将在GPU上执行,而无需您执行任何其他操作。您不需要编写任何CUDA。结果C
也是gpuArray
,您可以使用D
将其恢复到本地工作区中的正常数组D = gather(C)
。