我使用0.025秒长的Hamming窗口和32768点FFT(?)来计算44100Hz采样音频信号的频谱,这是我的困惑:
所以我的问题是怎么回事?
从this非常好的解释我得出结论,32768点FFT通常意味着它意味着1秒间隔,而Voicebox's rfft函数(我使用的)确实提到它截断/填充采样到N.所以我假设它将我的小1103向量用0s填充到32768长向量,以便能够计算FFT。
嗯,这真的发生了吗?这可以改善分辨率,虽然只有信号的前1/32是非零的吗? (好吧,我想是的,但我想确定,因为这出现在论文辩护上 - 我现在就得到了这个想法,写这篇文章)。感谢您的反馈。
答案 0 :(得分:9)
时域中的零填充等效于频域中的内插(反之亦然)。因此,您可以提高分辨率,从而可以在点之间绘制更平滑的曲线。但是你还没有增加信息内容;您可以在非插值FFT输出上对插值FFT输出进行任何处理。
答案 1 :(得分:2)
正如Oli指出的那样,零填充FFT是一种插值方法。更具体地说,插值内核是您使用的窗口的变换。因此,在某些时候,您对“分辨率”的改进与所选窗口的形状和宽度相关,而不是与数据的光谱内容相关。