我有一个cuda代码,我已经实现了几个C2C 2D FFT。它们都使用相同的计划,但由于某种原因,2D FFT的时间很长,而且似乎变化很大。相同的数据大小FFT似乎需要0.4s到1.8s
这是针对1920x1080的FFT。那些时候看起来合情合理吗?
无论如何 - 我对CUDA 1-D批量FFT的快速体验有很好的经验。在行中采用一维FFT是否相同,然后在矩阵的列上再次得到与此二维FFT相同的结果?我以前在1D FFT的较大数据集中经历了几秒钟内发生的FFT,所以我希望能够解决其中一些结果。
由于
答案 0 :(得分:5)
1K×1K图像的2D变换需要2K 1D变换。因此,这些时间似乎是合理的。
有关详细信息,请查看:http://paulbourke.net/miscellaneous/dft/