我正在尝试为具有sm_10
架构的GPU编译我的CUDA C代码,该架构不支持从malloc
函数调用__global__
。
我需要保留一个树,在GPU内存中动态创建节点。不幸的是,没有malloc
显然我不能这样做。
是否有办法使用cudaMalloc
复制整棵树?我认为这样的方法只会复制我树的根。
答案 0 :(得分:3)
引用CUDA C编程指南
动态全局内存分配和操作仅受设备支持 计算能力2.x及更高。
对于早于2.0
的计算能力,唯一的可能性是:
cudaMalloc
在__global__
功能中根据需要分配全局内存;