链接

时间:2018-05-29 09:48:29

标签: c++ cmake cuda undefined-reference

我维护C+=-flavored CUDA API wrappers库。该库的当前提交相对较好,包含一些示例程序和相当多的用户。然而,最近的某个时候(不能确切地说出什么时候),并且没有提交任何新内容,我现在在" dlink"期间收到NVCC警告。我的示例程序的阶段,例如:

/path/to/nvcc /path/to/cuda-api-wrappers/examples/modified_cuda_samples/vectorAdd/vectorAdd.cu -dc -o /path/to/cuda-api-wrappers/CMakeFiles/vectorAdd.dir/examples/modified_cuda_samples/vectorAdd/./vectorAdd_generated_vectorAdd.cu.o -ccbin /opt/gcc-5.4.0/bin/gcc -m64 -gencode arch=compute_52,code=compute_52 --std=c++11 -Xcompiler -Wall -O3 -DNDEBUG -DNVCC -I/path/to/cuda/include -I/path/to/cuda-api-wrappers/src
/path/to/nvcc -gencode arch=compute_52,code=compute_52 --std=c++11 -Xcompiler -Wall -O3 -DNDEBUG -m64 -ccbin /opt/gcc-5.4.0/bin/gcc -dlink /export/path/to/cuda-api-wrappers/CMakeFiles/vectorAdd.dir/examples/modified_cuda_samples/vectorAdd/./vectorAdd_generated_vectorAdd.cu.o /path/to/cuda/lib64/libcublas_device.a -o /export/path/to/cuda-api-wrappers/CMakeFiles/vectorAdd.dir/./vectorAdd_intermediate_link.o
@O@ptxas info    : 'device-function-maxrregcount' is a BETA feature
@O@ptxas info    : 'device-function-maxrregcount' is a BETA feature
@O@ptxas info    : 'device-function-maxrregcount' is a BETA feature
... this repeats many times ...

但dlink面孔确实结束了。这已经很奇怪,因为我还没有明确使用任何测试版功能。

/opt/gcc-5.4.0/bin/g++   -Wall -Wpedantic -O2 -DNDEBUG  -L/path/to/cuda/lib64 -rdynamic CMakeFiles/vectorAdd.dir/examples/modified_cuda_samples/vectorAdd/vectorAdd_generated_vectorAdd.cu.o CMakeFiles/vectorAdd.dir/vectorAdd_intermediate_link.o  -o examples/bin/vectorAdd lib/libcuda-api-wrappers.a -Wl,-Bstatic -lcudart_static -Wl,-Bdynamic -lpthread -ldl -lrt -lnvToolsExt -Wl,-Bstatic -lcudadevrt -Wl,-Bdynamic 
CMakeFiles/vectorAdd.dir/vectorAdd_intermediate_link.o: In function `__cudaRegisterLinkedBinary_25_cublas_compute_70_cpp1_ii_f0559976':
link.stub:(.text+0xe0): undefined reference to `__fatbinwrap_25_cublas_compute_70_cpp1_ii_f0559976'
CMakeFiles/vectorAdd.dir/vectorAdd_intermediate_link.o: In function `__cudaRegisterLinkedBinary_25_xerbla_compute_70_cpp1_ii_cd7f3ad3':
link.stub:(.text+0x190): undefined reference to `__fatbinwrap_25_xerbla_compute_70_cpp1_ii_cd7f3ad3'
CMakeFiles/vectorAdd.dir/vectorAdd_intermediate_link.o: In function `__cudaRegisterLinkedBinary_23_nrm2_compute_70_cpp1_ii_8edbce95':
link.stub:(.text+0x240): undefined reference to `__fatbinwrap_23_nrm2_compute_70_cpp1_ii_8edbce95'
... more udnefined reference errors here ...

我的问题:为什么会发生这种情况,我该如何规避/避免/解决它?

注意:

  • 我正在使用可分离的编译
  • 我在使用CUDA 9.1和SM 5.2设备(无7.0)时遇到了这些特定错误。
  • CMakeLists.txthere
  • 我在构建之前明显要清除CMakeCache.txt
  • 在GNU / Linux Mint 18.3和Fedora 26上都发生了这种情况。在第一台机器上已经完成了一些apt-get dist-upgrade,现在GCC达到5.5.0版本,如果重要的话。在第二台机器上 - 我确实没有发现任何变化;相同的编译器和CUDA版本。

1 个答案:

答案 0 :(得分:1)

部分答案/解决方法:

仅在涉及libcublas时才会出现此问题。如果我从/path/to/cuda/lib64/libcublas_device.a阶段命令行中删除-dlink,则所有警告和错误都会消失(包括后续阶段)。事实上,我的包装库没有看到cublas,不知道为什么CMake会添加它;它不在$CUDA_LIBRARIES。另见:

Why does CMake force the use of libcublas with separable compilation?