标签: opencl
我知道如何将数组从主机复制到GPU。但是如果我有一个存储在主机上的列主矩阵我想要复制到GPU上的缓冲区会发生什么。
还有其他方法可以在forloop中复制一个元素吗?
A_host [0 3 6 1 4 7 2 5 8]。
GPUBuffer = [0 1 2 3 4 5 6 7 8]。
答案 0 :(得分:3)
在这种情况下,如果矩阵足够大,您可能希望“按原样”将其发送到GPU,并插入一个额外的转置内核(或将其合并到您的第一个内核)。