是否有任何相应的3D阵列分配和复制方法,如 cudaMallocPitch()
和 cudaMemcpy2D()
?
谢谢!
答案 0 :(得分:3)
cudaMalloc3D()
cudaMalloc3DArray()
cudaMemcpy3D()
答案 1 :(得分:0)
您还可以使用cudaMallocPitch()
通过将height
定义为height * depth
来为3D数据分配线性设备存储器,并且只要考虑到以下因素,就可以在内核中进行合并访问:从cudaMallocPitch()
返回的音调和一些索引算法。
类似地,您可以使用cudaMalloc3D()
在设备上分配逻辑1D,2D或3D内存对象,并获得pitchedDevPtr
在内核中使用。