FFT性能数据

时间:2018-01-17 17:41:02

标签: algorithm performance gpu fft cpu

我想知道现在可以达到什么时间来计算2D FFT。只需一个数量级,即1K x 1K或2K x 2K图像。

欢迎提供链接或个人经验。

1 个答案:

答案 0 :(得分:2)

重新运行简单测试以供参考:

FFTW库3.3。5(2016年)。我使用了预编译的dll,他们利用SSE,但我不确定AVX
Windows 7 32位。英特尔i5-4670(Haswell 4核心)

单精度,真实到复杂的不合适的2D变换(使用fftwf_plan_dft_r2c_2d)。

1024 x 1024: 
        Single thread: 5 ms per iteration
        Two threads: 3.8 ms per iteration
        Four threads: 2.4 ms per iteration

2048 x 2048: 
        Single thread: 28 ms per iteration
        Two threads: 16 ms per iteration
        Four threads: 12 ms per iteration

双精度,真实到复杂的不合适的2D变换(使用fftw_plan_dft_r2c_2d)。

1024 x 1024: 
     Single thread: 7 ms per iteration
     Four threads: 3 ms per iteration