如何从c文件调用放置在.cu文件中的C函数?

时间:2016-05-22 14:28:42

标签: c cuda linker

我需要将C函数放在C文件(.c)中的cuda(.cu)文件中。我的层次结构看起来像那样。

的main.c

#include <stdio.h>

#include "dbgHelpers.h"
#include "arffReader.h"
#include "CPU_k_means.h"
#include "CUDA_k_means.h"

#include "defines.h"

int main() {
    //actions
    uint cudaTime = runCudaKMeans(h_objects, objectsNum, parametersNum, clustersNum, repeatesNum, streamsNum);
    //actions
    return 0;
}

CUDA_k_means.cu

#include "CUDA_k_means.h"

#include <cuda.h>
#include <cuda_runtime.h>
#include <stdio.h>

extern "C" {
#include "dbgHelpers.h"
}

__constant__ uint d_CLUST_NUM;
__constant__ uint d_OBJ_NUM;
__constant__ uint d_PARAMS_NUM;
__constant__ uint d_OBJ_PER_STREAM;
__constant__ uint d_OBJ_FOR_LAST_STREAM;

extern __shared__ uint sharedData[];

__global__ void calcDistances(ptype* d_objects, ptype* d_clustersCenters, ptype* d_distances)
{
    //algorithm
}

__global__ void clusterize(ptype* d_distances, uint* d_clustersMap)
{
    //algorithm
}

//and more kernels

uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum) {
    //algorithm
    calcDistances<<32, 32>>();
    //and so on
}

CUDA_k_means.h

#ifndef CUDA_K_MEANS_H_
#define CUDA_K_MEANS_H_

#include "defines.h"

uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum);

#endif

我无法正确链接。 NSight返回此错误。

/usr/local/cuda-7.5/bin/nvcc --cudart static --relocatable-device-code=false -gencode arch=compute_20,code=compute_20 -gencode arch=compute_20,code=sm_21 -link -o  "lab5"  ./CPU_k_means.o ./CUDA_k_means.o ./arffReader.o ./dbgHelpers.o ./main.o   
./main.o: In function `main':
main.c:(.text.startup+0x8c): undefined reference to `runCudaKMeans'
collect2: error: ld returned 1 exit status
make: *** [lab5] Error 1

不知道该怎么做。我尝试了“extern C”的不同组合,但没有任何成功。它甚至可能吗?

1 个答案:

答案 0 :(得分:0)

终于找到了解决方案。

在CUDA_k_means.cu文件中。

第一行

#include "CUDA_k_means.h"

需要删除。

在同一个文件中,函数需要标记为“extern”C“所以它看起来像。

extern "C" uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum)

在CUDA_k_means.h中,如果你不想在main.c函数声明中包含它,那么必须看起来像

extern uint runCudaKMeans(ptype* h_objects, uint objectsNum, uint parametersNum, uint clustersNum, uint repeatesNum, uint streamsNum)

无法完全解释它是如何运作的。如果有人知道,你可以在这里解释一下。