我正在尝试使用CUDA的动态并行,但我无法完成编译步骤。
我正在开发具有Compute Capability 3.5和CUDA 7.5版的GPU。
根据我使用的编译命令中的开关,我收到不同的错误消息,但使用documentation,
我到了一行导致编译成功:
nvcc -arch=compute_35 -rdc=true cudaDynamic.cu -o cudaDynamic.out -lcudadevrt
但是当程序启动时,所有程序都会失败。同 CUDA-memcheck,对于每次调用API函数,我都会得到同样的错误 消息:
========= CUDA-MEMCHECK
========= Program hit cudaErrorUnknown (error 30) due to "unknown error" on CUDA API call to ...
我也试过这行(取自CUDA动态样本makefile):
nvcc -ccbin g++ -I../../common/inc -m64 -dc -gencode arch=compute_35,code=compute_35 -o cudaDynamic.out -c cudaDynamic.cu
但在执行时,我得到:
cudaDynamic.out: Permission denied
我想了解如何正确编译CUDA动态代码,因为到目前为止我尝试过的所有其他编译行都失败了。
答案 0 :(得分:0)
我通过完全重新安装CUDA解决了这个问题。
我现在能够编译CUDA样本和我自己的代码。