LLVM编译器支持的CUDA编译的最小计算能力是多少?

时间:2016-05-31 06:22:20

标签: cuda llvm llvm-clang ptx

可以使用LLVM编译器使用命令clang -Xclang -I$LIBCLC/include/generic -I$LIBCLC/include/ptx -Dcl_clang_storage_class_specifiers -O3 cudaFile.cu -S -o ptxOutputFile.ptx --cuda-gpu-arch=sm_XX

将CUDA源文件编译为PTX格式

sm_XX可以替换为sm_20,sm_30。对于计算能力1.0,当sm_XX替换为sm_10时,它会给出错误fatal error: cannot open file '/tmp/shared-25f2f5.s': No such file or directory 1 error generated.

因此,似乎LLVM的最小计算能力为2.0。这个假设是否正确?

1 个答案:

答案 0 :(得分:1)

应该是正确的。从CUDA 7.0开始,sm_1x的工具包和驱动程序支持都已停止。如果sm_20有效,则必须是最小值。

  

针对特斯拉架构的CUDA工具包和CUDA驱动程序支持   CUDA工具包和CUDA驱动程序不再支持sm_10,sm_11,sm_12和sm_13体系结构。因此,CU_TARGET_COMPUTE_1x枚举值已从CUDA标头中删除。

http://developer.download.nvidia.com/compute/cuda/7_0/Prod/doc/CUDA_Toolkit_Release_Notes.pdf