我们在Android设备上运行算法,每秒需要多次FFT计算,我们希望通过使用更高效的FFT版本来降低电池消耗。
目前我们正在使用Eigen的版本,我认为它使用的是kissFFT作为后端。我也尝试过为Android编译ARM的HPC库而没有太大的成功(尽管在服务器上测试它们比Eigen快3-4倍)。我也正在研究FFTW的实现,但它似乎只支持32位霓虹灯操作,即使它应该是Aarch64优化。
我知道arm-v8a为NEON指令集添加了双精度操作,所以它应该是可能的,但有没有任何实现呢? 我错了,在arm-v8a中对双数进行FFT是不可能的吗?