哪个是在GPU上找到FFT的最快库?请给出NVIDIA和ATI卡的答案。另外,如果可能的话,给出时间数字。
感谢。
答案 0 :(得分:4)
对于NVidia GPU,请查看CUFFT library。据我所知,AMD尚未在ATI GPU上实现FFT产品化,但可能值得关注ACML-GPU库。您还可以尝试查看应该在两个GPU上运行的OpenCL FFT libraries。
提供时间数据是不可能的,因为它的变化很大,取决于您拥有的实际硬件,问题规模等。
答案 1 :(得分:4)
NukadaFFT库应该是NVIDIA硬件上性能最高的FFT实现。有文件的链接记录了库的性能 - 在某些情况下,吞吐量比使用CUFFT运行相同的FFT要高25%。这需要灵活的代价,因为代码只支持基数为32的变换。