我想知道现在可以达到什么时间来计算2D FFT。只需一个数量级,即1K x 1K或2K x 2K图像。
欢迎提供链接或个人经验。
答案 0 :(得分:2)
重新运行简单测试以供参考:
FFTW库3.3。5(2016年)。我使用了预编译的dll,他们利用SSE
,但我不确定AVX
。
Windows 7 32位。英特尔i5-4670(Haswell 4核心)
单精度,真实到复杂的不合适的2D变换(使用fftwf_plan_dft_r2c_2d
)。
1024 x 1024:
Single thread: 5 ms per iteration
Two threads: 3.8 ms per iteration
Four threads: 2.4 ms per iteration
2048 x 2048:
Single thread: 28 ms per iteration
Two threads: 16 ms per iteration
Four threads: 12 ms per iteration
双精度,真实到复杂的不合适的2D变换(使用fftw_plan_dft_r2c_2d
)。
1024 x 1024:
Single thread: 7 ms per iteration
Four threads: 3 ms per iteration