我有一个由主机设备生成的本征数组,我想通过CUDA的统一内存将其放入GPU。我发现的大多数示例都首先传递一个指向cudaMallocManaged
的指针,并在随后启动数组之前在其中分配内存。我该如何做相反,即在主机上分配内存,用值填充它,然后将其移动到统一内存系统?
答案 0 :(得分:1)
除非将数据从主机分配复制到托管分配,否则无法完成此操作。 (大概不是您要问的。)
在IBM Power9平台上,您的host allocated data can still be accessed from device code,但是在x86平台上当前没有相应的方法。