袖口错误导致错误

时间:2015-09-23 02:15:19

标签: cufft

我需要帮助袖口,我的结果是错误的,我不知道为什么。

这是我的代码:

#include<stdio.h>
#include<stdlib.h>
#include <cufft.h>

__global__ void print(cufftDoubleComplex *c, int h, int w){
for(int i=0; i<1; i++){
        for (int j=0; j<w; j++){
                printf("(%d,%d): %f + %fi\n",i+1, j+1, c[i*w+j].x, c[i*w+j].y);
            }
        //printf("\n");
        }
}

int main(int argc, char *argv[]){
    cudaSetDevice(0);   

    int img_w=5;
    int img_h=5;

    double fx[img_w*img_h], *d_fx;  

    cudaMalloc((void**)&d_fx, img_w*img_h*sizeof(double));
    cufftDoubleComplex *otfFx;
    cudaMalloc((void**)&otfFx, img_w*img_h*sizeof(cufftDoubleComplex)); 

    for(int i=0; i<img_w*img_h; i++){
        fx[i]=0;
    }

    fx[0]=1;
    fx[img_w-1]=-1;
    cudaMemcpy(d_fx, fx, img_w*img_h*sizeof(double), cudaMemcpyHostToDevice);

    cufftHandle plan_fx;
    cufftPlan2d(&plan_fx, img_h, img_w, CUFFT_D2Z);
    cufftExecD2Z(plan_fx, d_fx, otfFx);

    print<<<1,1>>>(otfFx, img_h, img_w);
    cudaDeviceSynchronize();

    cufftDestroy(plan_fx);
    cudaFree(d_fx);
    cudaFree(otfFx);
    return 0;
}

这就是我在结果的第一行得到的结果:

0.00000 + 0.00000i 0.69098 - 0.95106i 1.80902 - 0.58779i 0.00000 + 0.00000i 0.69098 - 0.95105i

应该是:

0.00000 + 0.00000i 0.69098 - 0.95106i 1.80902 - 0.58779i 1.80902 + 0.58779i 0.69098 + 0.95106i

otfFx [14]之后一切都是垃圾,结果是5x3,结果应该是5x5。

这是八度代码,它给我“正确”的结果:

A=[1 0 0 0 -1; 0 0 0 0 0; 0 0 0 0 0; 0 0 0 0 0; 0 0 0 0 0];
fft2(A)

1 个答案:

答案 0 :(得分:0)

你说得对 - cuFFT输出大小为5x3的结果,因为D2Z / Z2D / R2C / C2R变换的结果是对称的。

cuFFT遵循标准的fft库惯例。请查看:http://www.fftw.org/doc/The-1d-Real_002ddata-DFT.html http://docs.nvidia.com/cuda/cufft/index.html#multi-dimensional

如果你想重新创建完整信号,你需要使用事实,即前半部分的元素是信号第二部分中元素的共轭。