从音频信号中理解Formants

时间:2016-10-22 16:28:13

标签: audio fft speech dft audio-processing

我在Formant Estimation using LPC Coefficients上阅读了Matlab教程。虽然我模糊地了解细节,但我们还不清楚为什么需要这样做。来自http://person2.sol.lu.se/SidneyWood/praate/whatform.html

  

共振峰是语音波中特定频率附近的声能浓度

为什么不能采用音频信号的DFT(必要时进行一些预处理后)?在频域中,峰值对应于这些浓度,正确吗?

1 个答案:

答案 0 :(得分:0)

游戏有点晚,但对于任何绊脚石的人来说。

显示语音信号频率响应的DFT或FFT表示声道的谐波。

Roy Snell提到的共振峰算法使用自相关方法找到代表共振峰的声道共振。这基本上是平滑的FFT / DFT,其中峰值代表共振峰。 LPC计算中有很多变量可以改变平滑效果。

Google Scholar对该领域以及书籍进行了大量研究,我推荐Acoustic&听觉语音,帮助我更好地理解它,这不是一个艰难的阅读!