无法编译/运行涉及动态并行的CUDA代码

时间:2016-06-20 15:25:23

标签: cuda dynamic-parallelism

我正在尝试使用CUDA的动态并行,但我无法完成编译步骤。

我正在开发具有Compute Capability 3.5和CUDA 7.5版的GPU。

根据我使用的编译命令中的开关,我收到不同的错误消息,但使用documentation

  • 我到了一行导致编译成功:

    nvcc -arch=compute_35 -rdc=true cudaDynamic.cu -o cudaDynamic.out -lcudadevrt
    

    但是当程序启动时,所有程序都会失败。同 CUDA-memcheck,对于每次调用API函数,我都会得到同样的错误 消息:

    ========= CUDA-MEMCHECK
    ========= Program hit cudaErrorUnknown (error 30) due to "unknown error" on CUDA API call to ...
    
  • 我也试过这行(取自CUDA动态样本makefile):

    nvcc -ccbin g++ -I../../common/inc -m64 -dc -gencode arch=compute_35,code=compute_35 -o cudaDynamic.out -c cudaDynamic.cu
    

    但在执行时,我得到:

    cudaDynamic.out: Permission denied
    

我想了解如何正确编译CUDA动态代码,因为到目前为止我尝试过的所有其他编译行都失败了。

1 个答案:

答案 0 :(得分:0)

我通过完全重新安装CUDA解决了这个问题。

我现在能够编译CUDA样本和我自己的代码。