我正在编写的代码采用每个正弦波1024个样本的窗口,获取每个窗口的FFT,并返回每个窗口的最大频率。我知道它们对于正弦波都是一样的,但它是用于测试的。我的代码主要工作,除了产生的频率似乎比它们应该低约10%。例如,440Hz的正弦在我的FFT中导致频率430处的最大幅度。我不能为我的生活找出导致这种情况的原因。有什么建议吗?
import math
import numpy as np
import matplotlib.pyplot as plt
import pylab as py
from scipy import fftpack
from pylab import *
import scipy.io.wavfile
def PARTA(window):
sr = 44100
x = arange(0., 2*pi, 1./sr)
samples = sin(2*pi*440*x)
time_step = 1. / sr
end = len(samples)/window
print end
'''Make a 2-D array of samples'''
windowed = []
maxes = []
for i in range(0, end):
windowed.append(samples[i*window:(i+1)*window])
for j in range(0, end):
ps = np.abs(np.fft.fft(windowed[j]))**2
freqs = np.fft.fftfreq(windowed[j].size, time_step)
max_y = max(ps) # Find the maximum y value
max_x = freqs[ps.argmax()] # Find the x value corresponding to the maximum y value
maxes.append(max_x)
end2 = float(len(samples)/sr)
#print end2
interval = end2/end
#print interval
x = arange(0., end2, interval)
y = []
for i in range(0, len(maxes)):
y.append(abs(maxes[i]))
return (x, y)
x, y = PARTA(1024)
plt.plot(x, y, 'ro')
plt.show()
答案 0 :(得分:0)
只是你的FFT具有非常粗糙的分辨率,因为它只有1024个分档。 FFT中的每个bin都具有44100 / 1024 = 43.1 Hz
的分辨率。您的440 Hz峰值将位于bin索引10处,其中心频率为10 * 44100 / 1024 = 430.66 Hz
。
有关FFT bin索引和相应频率的更多详细信息,请参阅this question。