Question

在下面的代码中，如果我将#define N 65536带到#if FSIZE之上，那么我会收到以下错误：

#if FSIZE==1
__global__ void compute_sum1(float *a, float *b, float *c, int N)
{
#define N 65536
        int majorIdx = blockIdx.x;
        int subIdx = threadIdx.x;

        int idx=majorIdx*32+subIdx ;

        float sum=0;

        int t=4*idx;
        if(t<N)
        {
                c[t]= a[t]+b[t];
                c[t+1]= a[t+1]+b[t+1];
                c[t+2]= a[t+2]+b[t+2];
                c[t+3]= a[t+3]+b[t+3];
        }
        return;
}
#elif FSIZE==2
__global__ void compute_sum2(float2 *a, float2 *b, float2 *c, int N)
#define N 65536
{
        int majorIdx = blockIdx.x;
        int subIdx = threadIdx.x;

        int idx=majorIdx*32+subIdx ;

        float sum=0;

        int t=2*idx;
        if(t<N)
        {
                c[t].x= a[t].x+b[t].x;
                c[t].y= a[t].y+b[t].y;
                c[t+1].x= a[t+1].x+b[t+1].x;
                c[t+1].y= a[t+1].y+b[t+1].y;
        }
        return ;
}

float1vsfloat2.cu（10）：错误：预期为“）”

这个问题有点烦人，我真的很想知道它为什么会发生。我有一种感觉，我忽略了一些非常愚蠢的东西。顺便说一句，这段代码部分位于文件的顶部。甚至在它之前都没有#include。我将非常感谢任何可能的解释。

Answer 1

预处理器更改了这一行：

__global__ void compute_sum1(float *a, float *b, float *c, int N)

到

__global__ void compute_sum1(float *a, float *b, float *c, int 65536)

这是无效的CUDA代码。

Cuda代码#define错误，预计“）”

1 个答案: