我正在玩numpy.fft库。我有200个带单个音符的.wav文件,每个文件长约4秒。我逐个运行numpy.fft但是对于4.5秒或更长时间的样本numpy.fft冻结。我不明白为什么会这样?此外,如果我明确指定fft的长度,该功能工作正常,但它检测错误的频率(它检测频率偏移一个或两个半音更高)。
这是我的代码:
(framerate, sample) = wav.read(wav_file)
monoChannel = sample.mean(axis=1)
fft_length = int(duration * framerate) # duration is usually around 4sec long
FFT = numpy.fft(monoChannel, n=fft_length)
对于fft_length小于216090的样本numpy.fft工作正常,对于任何更长的fft,算法会挂起但是在我按下终端中的ctrl + C后它会继续。
我正在使用python 2.7.3
我是FFT的新手,我真的很想了解这里发生了什么。
答案 0 :(得分:1)
np.fft
中使用的FFT算法在输入长度具有许多小素数因子时非常好(意味着O(n log n)),并且非常差(意味着需要O(n ^ 2)的天真DFT) )当输入大小是素数时。查看两个幂和下一个最小素数的一些示例时序:
In [69]: a = np.random.rand(1024)
In [70]: b = np.random.rand(1031)
In [71]: %timeit np.fft.fft(a)
10000 loops, best of 3: 20.8 µs per loop
In [72]: %timeit np.fft.fft(b)
100 loops, best of 3: 2.09 ms per loop
In [73]: a = np.random.rand(65536)
In [74]: b = np.random.rand(65537)
In [75]: %timeit np.fft.fft(a)
100 loops, best of 3: 3.16 ms per loop
In [76]: %timeit np.fft.fft(b)
1 loops, best of 3: 11.8 s per loop
对于您的具体情况,请注意:
216090 = 2 * 3**2 * 5 * 7**4
216091 = 216091 (prime)
216092 = 2**2 * 89 * 607
因此:
In [77]: %timeit np.fft.fft(np.random.rand(216090))
10 loops, best of 3: 37.1 ms per loop
In [78]: %timeit np.fft.fft(np.random.rand(216092))
10 loops, best of 3: 149 ms per loop
In [79]: %timeit np.fft.fft(np.random.rand(216091))
# Got bored and killed it before it finished, should take ~2 min
# based on the other results for prime numbers