如何在OpenCL中将无顺序数据复制到GPU内存缓冲区?

时间:2013-03-15 20:22:17

标签: opencl

我知道如何将数组从主机复制到GPU。但是如果我有一个存储在主机上的列主矩阵我想要复制到GPU上的缓冲区会发生什么。

还有其他方法可以在forloop中复制一个元素吗?

A_host [0 3 6         1 4 7         2 5 8]。

GPUBuffer = [0 1 2 3 4 5 6 7 8]。

1 个答案:

答案 0 :(得分:3)

在这种情况下,如果矩阵足够大,您可能希望“按原样”将其发送到GPU,并插入一个额外的转置内核(或将其合并到您的第一个内核)。