我在Formant Estimation using LPC Coefficients上阅读了Matlab教程。虽然我模糊地了解细节,但我们还不清楚为什么需要这样做。来自http://person2.sol.lu.se/SidneyWood/praate/whatform.html:
共振峰是语音波中特定频率附近的声能浓度
为什么不能采用音频信号的DFT(必要时进行一些预处理后)?在频域中,峰值对应于这些浓度,正确吗?
答案 0 :(得分:0)
游戏有点晚,但对于任何绊脚石的人来说。
显示语音信号频率响应的DFT或FFT表示声道的谐波。
Roy Snell提到的共振峰算法使用自相关方法找到代表共振峰的声道共振。这基本上是平滑的FFT / DFT,其中峰值代表共振峰。 LPC计算中有很多变量可以改变平滑效果。
Google Scholar对该领域以及书籍进行了大量研究,我推荐Acoustic&听觉语音,帮助我更好地理解它,这不是一个艰难的阅读!