我是CUDA编程的新手。为了练习,我试图运行一个非常简单的程序,将两个数组中的元素一起添加,然后将结果存储在一个新数组中。出于组织目的,我试图通过将代码分成多个文件来实现此目的。谢谢你的进步!
我在尝试编译时遇到此错误: " hello.cpp:6:错误:'void'之前的预期构造函数,析构函数或类型转换"
这是代码: 的 HELLO.CPP
#include <simple.h>
#include <stdlib.h>
#include <stdio.h>
#define N 100
__global__ void add(int *a, int *b, int *c)
{
int tID = blockIdx.x;
if (tID < N)
{
adding(a, b, c, tID);
}
}
int main()
{
int a[N], b[N], c[N];
int *dev_a, *dev_b, *dev_c;
cudaMalloc((void **) &dev_a, N*sizeof(int));
cudaMalloc((void **) &dev_b, N*sizeof(int));
cudaMalloc((void **) &dev_c, N*sizeof(int));
// Fill Arrays
for (int i = 0; i < N; i++)
{
a[i] = i,
b[i] = 1;
}
cudaMemcpy(dev_a, a, N*sizeof(int), cudaMemcpyHostToDevice);
cudaMemcpy(dev_b, b, N*sizeof(int), cudaMemcpyHostToDevice);
add<<<N,1>>>(dev_a, dev_b, dev_c);
cudaMemcpy(c, dev_c, N*sizeof(int), cudaMemcpyDeviceToHost);
for (int i = 0; i < N; i++)
{
printf("%d + %d = %d\n", a[i], b[i], c[i]);
}
return 0;
}
simple.cpp
#include <simple.h>
__device__ void adding(int *a, int *b, int *c, int tID)
{
c[tID] = a[tID] + b[tID];
}
simple.h
#ifndef __simple_h__
#define __simple_h__
__device__ void adding(int *a, int *b, int *c, int tID);
#endif
生成文件
objects = hello.o simple.o
all: $(objects)
/usr/local/cuda-7.0/bin/nvcc -arch=sm_20 $(objects) -o app
%.o: %.cpp %.cu
/usr/local/cuda-7.0/bin/nvcc -x cu -arch=sm_20 -I. -dc $< -o $@
clean:
rm -f *.o app
答案 0 :(得分:1)
当我在计算机上运行您的项目时,make
似乎在编译* .cpp文件时使用其implicit variables,导致使用g++
而不是使用nvcc
你指定了。
要更改此行为,您必须设置变量CXX
和CXXFLAGS
。以下Makefile
为我工作:
objects = hello.o simple.o
CXX = /usr/local/cuda-7.0/bin/nvcc
CXXFLAGS = -x cu -arch=sm_20 -I. -dc
all: $(objects)
$(CXX) $(objects) -o app
%.o: %.cpp %.cu
$(CXX) $(CXXFLAGS) $< -o $@
答案 1 :(得分:0)
这可能是因为主机端cpp文件上__global__
的声明。尝试将所有cuda代码放在.cu文件中。