Question

我试图做一个简单的fft并比较MATLAB和CUDA之间的结果。

MATLAB：向量的9个数字1-9

I = [1 2 3 4 5 6 7 8 9];

并使用此代码：

fft(I)

给出结果：

  45.0000 + 0.0000i
  -4.5000 +12.3636i
  -4.5000 + 5.3629i
  -4.5000 + 2.5981i
  -4.5000 + 0.7935i
  -4.5000 - 0.7935i
  -4.5000 - 2.5981i
  -4.5000 - 5.3629i
  -4.5000 -12.3636i

和CUDA代码：

int FFT_Test_Function() {

    int n = 9;

    double* in = new double[n];
    Complex* out = new Complex[n];

    for (int i = 0; i<n; i++)
    {
        in[i] = i + 1;
    }

    // Allocate the buffer
    cufftDoubleReal *d_in;
    cufftDoubleComplex *d_out;
    unsigned int out_mem_size = sizeof(cufftDoubleComplex)*n;
    unsigned int in_mem_size = sizeof(cufftDoubleReal)*n;
    cudaMalloc((void **)&d_in, in_mem_size);
    cudaMalloc((void **)&d_out, out_mem_size);

    // Save time stamp
    milliseconds timeStart = getCurrentTimeStamp();

    cufftHandle plan;
    cufftResult res = cufftPlan1d(&plan, n, CUFFT_D2Z, 1);
    if (res != CUFFT_SUCCESS) { cout << "cufft plan error: " << res << endl; return 1; }
    cudaCheckErrors("cuda malloc fail");

    cudaMemcpy(d_in, in, in_mem_size, cudaMemcpyHostToDevice);
    cudaCheckErrors("cuda memcpy H2D fail");

    res = cufftExecD2Z(plan, d_in, d_out);
    if (res != CUFFT_SUCCESS) { cout << "cufft exec error: " << res << endl; return 1; }
    cudaMemcpy(out, d_out, out_mem_size, cudaMemcpyDeviceToHost);
    cudaCheckErrors("cuda memcpy D2H fail");

    milliseconds timeEnd = getCurrentTimeStamp();
    milliseconds totalTime = timeEnd - timeStart;
    std::cout << "Total time: " << totalTime.count() << std::endl;

    return 0;
}

在这个CUDA代码中我得到了结果：

你可以看到CUDA给出4个零（单元格5-9）。

我错过了什么？

非常感谢你的关注！

Answer 1

CUFFT_D2Z是一个真实到复数的FFT，因此输出数据中的顶部N/2 - 1点是多余的 - 它们只是变换下半部分的复共轭（你可以看到）如果您比较关于中点的镜像对，则在MATLAB输出中这样做。

你可以填写这些＆＃34;缺失＆＃34;如果你需要它们，只需要考虑每个相应术语的复数共轭，但通常没有多大意义。

CUDA fft与MATLAB fft的结果不同

1 个答案: