我需要将C函数放在C文件(.c)中的cuda(.cu)文件中。我的层次结构看起来像那样。
的main.c
#include <stdio.h>
#include "dbgHelpers.h"
#include "arffReader.h"
#include "CPU_k_means.h"
#include "CUDA_k_means.h"
#include "defines.h"
int main() {
//actions
uint cudaTime = runCudaKMeans(h_objects, objectsNum, parametersNum, clustersNum, repeatesNum, streamsNum);
//actions
return 0;
}
CUDA_k_means.cu
#include "CUDA_k_means.h"
#include <cuda.h>
#include <cuda_runtime.h>
#include <stdio.h>
extern "C" {
#include "dbgHelpers.h"
}
__constant__ uint d_CLUST_NUM;
__constant__ uint d_OBJ_NUM;
__constant__ uint d_PARAMS_NUM;
__constant__ uint d_OBJ_PER_STREAM;
__constant__ uint d_OBJ_FOR_LAST_STREAM;
extern __shared__ uint sharedData[];
__global__ void calcDistances(ptype* d_objects, ptype* d_clustersCenters, ptype* d_distances)
{
//algorithm
}
__global__ void clusterize(ptype* d_distances, uint* d_clustersMap)
{
//algorithm
}
//and more kernels
uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum) {
//algorithm
calcDistances<<32, 32>>();
//and so on
}
CUDA_k_means.h
#ifndef CUDA_K_MEANS_H_
#define CUDA_K_MEANS_H_
#include "defines.h"
uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum);
#endif
我无法正确链接。 NSight返回此错误。
/usr/local/cuda-7.5/bin/nvcc --cudart static --relocatable-device-code=false -gencode arch=compute_20,code=compute_20 -gencode arch=compute_20,code=sm_21 -link -o "lab5" ./CPU_k_means.o ./CUDA_k_means.o ./arffReader.o ./dbgHelpers.o ./main.o
./main.o: In function `main':
main.c:(.text.startup+0x8c): undefined reference to `runCudaKMeans'
collect2: error: ld returned 1 exit status
make: *** [lab5] Error 1
不知道该怎么做。我尝试了“extern C”的不同组合,但没有任何成功。它甚至可能吗?
答案 0 :(得分:0)
终于找到了解决方案。
在CUDA_k_means.cu文件中。
第一行
#include "CUDA_k_means.h"
需要删除。
在同一个文件中,函数需要标记为“extern”C“所以它看起来像。
extern "C" uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum)
在CUDA_k_means.h中,如果你不想在main.c函数声明中包含它,那么必须看起来像
extern uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum)
无法完全解释它是如何运作的。如果有人知道,你可以在这里解释一下。