CUDA C ++链接错误未定义参考threadIdx.x

时间:2016-02-05 15:48:12

标签: c++ cuda linker-errors

你好试图在CUDA上并行化Lattice Boltzmann解算器。 不知何故,我在将目标文件链接在一起时收到错误。对象编译时没有错误。

  

LBMSolver.o:在函数> LBMSolver::calcMoments_GPU(LBMUniformGrid2D::LBMGridNode**, int)': tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp:(.text+0x939): undefined >reference to blockDim'中   tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp :(。text + 0x93f):undefined>对blockIdx' tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp:(.text+0x948): undefined >reference to threadIdx'的引用   tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp :(。text + 0x953):undefined>对blockDim' tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp:(.text+0x959): undefined >reference to blockIdx'的引用   tmpxft_00004b33_00000000-3_LBMSolver.cudafe1.cpp :(。text + 0x962):undefined>对`threadIdx'的引用

这是我的Makefile:

OBJS = main.o LBMSolver.o LBMUniformGrid2D.o LBMBoundaryConditions.o   writeVTK.o
CC = g++
NVCC = nvcc
CFLAGS = -Wall -c 
LFLAGS = -Wall
XCOMPILER = -Xcompiler "-Wall"
NVCFLAGS = -c -G -g -ccbin=$(CC) $(XCOMPILER)
NVLFLAGS = -G -g -ccbin=$(CC) $(XCOMPILER)


main : $(OBJS)
    $(NVCC) $(NVLFLAGS) $(OBJS) -o main 

main.o : main.cu LBMSolver.h writeVTK.h
    $(NVCC) $(NVCFLAGS) main.cu

LBMSolver.o : LBMSolver.cu LBMSolver.h LBMUniformGrid2D.h LBMBoundaryConditions.h
    $(NVCC) $(NVCFLAGS) LBMSolver.cu

LBMBoundaryConditions.o : LBMBoundaryConditions.cu LBMBoundaryConditions.h LBMSolver.h
    $(NVCC) $(NVCFLAGS) LBMBoundaryConditions.cu

LBMUniformGrid2D.o : LBMUniformGrid2D.cpp LBMUniformGrid2D.h
    $(CC) $(CFLAGS) LBMUniformGrid2D.cpp

writeVTK.o : writeVTK.h writeVTK.cpp
    $(CC) $(CFLAGS) writeVTK.cpp

clean_obj: 
    \rm *.o main

提供错误的函数和头文件:

#pragma once
#include "LBMUniformGrid2D.h"
#include <cuda.h>

#ifdef __CUDACC__
#define CUDA_HOSTDEV __host__ __device__
#else
#define CUDA_HOSTDEV
#endif

class LBMSolver{
...
CUDA_HOSTDEV void calcMoments_GPU(LBMUniformGrid2D::LBMGridNode **field, int nx);

__host__ __device__ void LBMSolver::calcMoments_GPU(LBMUniformGrid2D::LBMGridNode **field, int nx){
    int x = blockDim.x * blockIdx.x + threadIdx.x;
    int y = blockDim.y * blockIdx.y + threadIdx.y;

    LBMUniformGrid2D::LBMGridNode *node;
    node = field[x+y*nx];
    calc_rho_GPU(node);
    calc_ux_GPU(node);
    calc_uy_GPU(node);
    calc_v_GPU(node);
}

1 个答案:

答案 0 :(得分:1)

您无法将包含设备代码的功能定义为__host__,因为主机代码不支持设备特定功能。删除它,事情可能会正确编译。