我需要帮助袖口,我的结果是错误的,我不知道为什么。
这是我的代码:
#include<stdio.h>
#include<stdlib.h>
#include <cufft.h>
__global__ void print(cufftDoubleComplex *c, int h, int w){
for(int i=0; i<1; i++){
for (int j=0; j<w; j++){
printf("(%d,%d): %f + %fi\n",i+1, j+1, c[i*w+j].x, c[i*w+j].y);
}
//printf("\n");
}
}
int main(int argc, char *argv[]){
cudaSetDevice(0);
int img_w=5;
int img_h=5;
double fx[img_w*img_h], *d_fx;
cudaMalloc((void**)&d_fx, img_w*img_h*sizeof(double));
cufftDoubleComplex *otfFx;
cudaMalloc((void**)&otfFx, img_w*img_h*sizeof(cufftDoubleComplex));
for(int i=0; i<img_w*img_h; i++){
fx[i]=0;
}
fx[0]=1;
fx[img_w-1]=-1;
cudaMemcpy(d_fx, fx, img_w*img_h*sizeof(double), cudaMemcpyHostToDevice);
cufftHandle plan_fx;
cufftPlan2d(&plan_fx, img_h, img_w, CUFFT_D2Z);
cufftExecD2Z(plan_fx, d_fx, otfFx);
print<<<1,1>>>(otfFx, img_h, img_w);
cudaDeviceSynchronize();
cufftDestroy(plan_fx);
cudaFree(d_fx);
cudaFree(otfFx);
return 0;
}
这就是我在结果的第一行得到的结果:
0.00000 + 0.00000i 0.69098 - 0.95106i 1.80902 - 0.58779i 0.00000 + 0.00000i 0.69098 - 0.95105i
应该是:
0.00000 + 0.00000i 0.69098 - 0.95106i 1.80902 - 0.58779i 1.80902 + 0.58779i 0.69098 + 0.95106i
otfFx [14]之后一切都是垃圾,结果是5x3,结果应该是5x5。
这是八度代码,它给我“正确”的结果:
A=[1 0 0 0 -1; 0 0 0 0 0; 0 0 0 0 0; 0 0 0 0 0; 0 0 0 0 0];
fft2(A)
答案 0 :(得分:0)
你说得对 - cuFFT输出大小为5x3的结果,因为D2Z / Z2D / R2C / C2R变换的结果是对称的。
cuFFT遵循标准的fft库惯例。请查看:http://www.fftw.org/doc/The-1d-Real_002ddata-DFT.html http://docs.nvidia.com/cuda/cufft/index.html#multi-dimensional
如果你想重新创建完整信号,你需要使用事实,即前半部分的元素是信号第二部分中元素的共轭。