可以使用LLVM编译器使用命令clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX
sm_XX可以替换为sm_20,sm_30。对于计算能力1.0,当sm_XX替换为sm_10时,它会给出错误fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory
1 error generated.
因此,似乎LLVM的最小计算能力为2.0。这个假设是否正确?
答案 0 :(得分:1)
应该是正确的。从CUDA 7.0开始,sm_1x的工具包和驱动程序支持都已停止。如果sm_20有效,则必须是最小值。
针对特斯拉架构的CUDA工具包和CUDA驱动程序支持 CUDA工具包和CUDA驱动程序不再支持sm_10,sm_11,sm_12和sm_13体系结构。因此,CU_TARGET_COMPUTE_1x枚举值已从CUDA标头中删除。
http://developer.download.nvidia.com/compute/cuda/7_0/Prod/doc/CUDA_Toolkit_Release_Notes.pdf