在下面的代码中,如果我将#define N 65536带到#if FSIZE之上,那么我会收到以下错误:
#if FSIZE==1
__global__ void compute_sum1(float *a, float *b, float *c, int N)
{
#define N 65536
int majorIdx = blockIdx.x;
int subIdx = threadIdx.x;
int idx=majorIdx*32+subIdx ;
float sum=0;
int t=4*idx;
if(t<N)
{
c[t]= a[t]+b[t];
c[t+1]= a[t+1]+b[t+1];
c[t+2]= a[t+2]+b[t+2];
c[t+3]= a[t+3]+b[t+3];
}
return;
}
#elif FSIZE==2
__global__ void compute_sum2(float2 *a, float2 *b, float2 *c, int N)
#define N 65536
{
int majorIdx = blockIdx.x;
int subIdx = threadIdx.x;
int idx=majorIdx*32+subIdx ;
float sum=0;
int t=2*idx;
if(t<N)
{
c[t].x= a[t].x+b[t].x;
c[t].y= a[t].y+b[t].y;
c[t+1].x= a[t+1].x+b[t+1].x;
c[t+1].y= a[t+1].y+b[t+1].y;
}
return ;
}
float1vsfloat2.cu(10):错误:预期为“)”
这个问题有点烦人,我真的很想知道它为什么会发生。我有一种感觉,我忽略了一些非常愚蠢的东西。顺便说一句,这段代码部分位于文件的顶部。甚至在它之前都没有#include。 我将非常感谢任何可能的解释。
答案 0 :(得分:14)
预处理器更改了这一行:
__global__ void compute_sum1(float *a, float *b, float *c, int N)
到
__global__ void compute_sum1(float *a, float *b, float *c, int 65536)
这是无效的CUDA代码。