如何并行多个gpuArray矩阵?

时间:2013-08-07 13:25:58

标签: matlab gpu

给定矩阵 A 1 ,...,A n B 1 , ...,B n 存储为gpuArray,我想计算矩阵 C i = A i < /子> * B <子> I

所有 A i 的大小相同,且所有 B i & #39; s具有相同(可能不同)的大小。

如果 n 非常大并且矩阵的大小相对较小,我如何在GPU上快速完成此操作?是否可以避免使用CUDA?

2 个答案:

答案 0 :(得分:2)

如果你有MATLAB R2013b,你可以使用新的gpuArray pagefun函数。

答案 1 :(得分:1)

如果AB属于gpuArray类,则操作C = A*B将在GPU上执行,而无需您执行任何其他操作。您不需要编写任何CUDA。结果C也是gpuArray,您可以使用D将其恢复到本地工作区中的正常数组D = gather(C)