audio - 从音频信号中理解Formants

时间：2016-10-22 16:28:13

标签： audio fft speech dft audio-processing

我在Formant Estimation using LPC Coefficients上阅读了Matlab教程。虽然我模糊地了解细节，但我们还不清楚为什么需要这样做。来自http://person2.sol.lu.se/SidneyWood/praate/whatform.html：

共振峰是语音波中特定频率附近的声能浓度

为什么不能采用音频信号的DFT（必要时进行一些预处理后）？在频域中，峰值对应于这些浓度，正确吗？

答案 0 :(得分：0)

游戏有点晚，但对于任何绊脚石的人来说。

显示语音信号频率响应的DFT或FFT表示声道的谐波。

Roy Snell提到的共振峰算法使用自相关方法找到代表共振峰的声道共振。这基本上是平滑的FFT / DFT，其中峰值代表共振峰。 LPC计算中有很多变量可以改变平滑效果。

Google Scholar对该领域以及书籍进行了大量研究，我推荐Acoustic＆amp;听觉语音，帮助我更好地理解它，这不是一个艰难的阅读！