CURAND Library - Compiling Error - Undefined reference to functions
我认为我对链接器标志的理解不太重要,因为我不明白如何使用它们。我是否需要将代码放在我运行它的程序的makefile中?有人可以通过写出语法和我需要把它放在哪里来解释吗?另外,我可以简单地将CUDA库中的curand.lib文件放在我想要使用的程序文件夹中并从那里引用它吗?
这是我试图用来为光线跟踪程序生成随机数的代码。非常感谢任何帮助。
float drandGPU()
{
std::size_t n = 1;
std::size_t i;
curandGenerator_t gen;
float *devData, *hostData;
hostData = (float*) calloc(n, sizeof(float));
cudaMalloc((void**) &devData, n*sizeof(float));
curandCreateGenerator(&gen, CURAND_RNG_PSEUDO_MTGP32);
curandSetPseudoRandomGeneratorSeed(gen, 1234ULL);
curandGenerateUniform(gen,devData,n);
cudaMemcpy(hostData, devData, n*sizeof(float), cudaMemcpyDeviceToHost);
float f = hostData[0];
return f;
}
编辑:我在这里添加makefile:
all: exe
exe: pipe
g++ -o rayTracer -D__PIKOC_HOST__ -I/usr/local/cuda/include -I../../api/include -I../.. -I. main.cpp -L/usr/local/cuda/lib -lcuda -lGL -lglut
pipe:
../../bin/pikoc --numRuns=10 --timer main.cpp
clean:
rm -f rayTracer __pikoDefines.h __pikoCompiledPipe.h __pikoCompiledPipe.ptx
答案 0 :(得分:0)
在Linux命令行中,您可以使用Makefile轻松构建代码。假设您的文件名为main.cpp
,这里有一个Makefile,应编译您的代码:
CUDA_ROOT=/usr/local/cuda
NVCC=$(CUDA_ROOT)/bin/nvcc
NVCC_FLAGS=-ccbin g++ -m64
NVCC_ARCH_FLAGS=-gencode arch=compute_20,code=sm_20 -gencode arch=compute_30,code=sm_30
NVCC_IFLAGS=-I$(CUDA_ROOT)/include -I$(CUDA_ROOT)/samples/common/inc
LFLAGS=-lcurand
all: main.exe
main.o: main.cpp
$(NVCC) $(NVCC_FLAGS) $(NVCC_IFLAGS) $(NVCC_ARCH_FLAGS) -c $< -o $@
main.exe: main.o
$(NVCC) $(NVCC_FLAGS) $(NVCC_ARCH_FLAGS) $< -o $@ $(LFLAGS)
clean:
rm -f *.o
clobber: clean
rm -f main.exe
您需要做的就是将上面的代码段放在名为Makefile的文件中,并与您的代码放在同一目录中,然后键入make
。
这里发生的事情的简要总结是:
包含全部大写变量(如CUDA_ROOT
和NVCC
的Makefile的顶部是变量定义。这些变量在下面的编译和链接中使用美元符号,如$(NVCC)
。
此处,变量CUDA_ROOT
特别重要,可能会有所不同,具体取决于您拥有的Linux / CUDA安装。我实际上是/usr/local/cuda-6.5
,但它也与我在Makefile中使用的/usr/local/cuda
符号链接。您可能需要更改此变量。如果您有nvcc
命令可用,则键入which nvcc
应该会为您提供添加了/bin/nvcc
目录的路径。
键入make
会调用第一个目标规则,即all: main.exe
,main.exe
的规则需要main.o
,因此会转到main.o
的规则。因此,编译目标文件main.o
是第一步。那里没有链接,只是将.cpp
文件编译成.o
目标文件。然后,编译main.o
后,main.exe
与它链接,cuRAND库(因此LFLAGS
变量包含在main.exe
配方中)。
我还更改了您粘贴的代码以获得输出:
#include <curand_kernel.h>
#include <helper_cuda.h>
#include <iostream>
float drandGPU()
{
std::size_t n = 1;
std::size_t i;
curandGenerator_t gen;
float *devData, *hostData;
hostData = (float*) calloc(n, sizeof(float));
cudaMalloc((void**) &devData, n*sizeof(float));
curandCreateGenerator(&gen, CURAND_RNG_PSEUDO_MTGP32);
curandSetPseudoRandomGeneratorSeed(gen, 1234ULL);
curandGenerateUniform(gen,devData,n);
cudaMemcpy(hostData, devData, n*sizeof(float), cudaMemcpyDeviceToHost);
float f = hostData[0];
return f;
}
int main()
{
std::cout << drandGPU() << std::endl;
}
并将其命名为main.cpp
。