我正在使用动态并行来实现一个程序。每当我编译代码时,它都会抛出致命错误,如下所示:
ptxas fatal : Unresolved extern function 'cudaGetParameterBuffer'
编译如下:
nvcc -o dyn_par dyn_par.cu -arch=sm_35
如何解决?
答案 0 :(得分:5)
cudaGetParameterBuffer
是cudadevrt
库的一部分,您需要在编译器命令中指定并将--relocatable-device-code
指定为true
nvcc -o dyn_par dyn_par.cu -arch=sm_35 -lcudadevrt --relocatable-device-code true
了解更多信息,请查看Nvidia的CUDA Dynamic Parallelism Programming Guide(第21页介绍上述内容)