我想创建一个iOS应用程序,允许我绘制用户读入的音频样本的语调(语音音高的上升和下降)。语调在世界各地的语言中非常重要,这将是练习语调和发音的尝试。
我对语音/音频技术的世界不是很精通,所以我需要什么?是否有安装了Cocoa-touch的库,这使我能够从语音样本中访问我需要的数据?我到底想要捕捉到什么?
如果有人对我需要利用的技术有所了解,我会理解正确的方向。
谢谢!
答案 0 :(得分:1)
您正在寻找的是共振峰分析。
Formants实质上是发出声音的谱峰。它们按频率顺序列出,如f1,f2等。在我看来,你想要绘制的是f1。
Formant分析是语音识别的核心,通常f1和f2足以区分元音。我建议你搜索一下共振峰分析算法并从中获取它。
祝你好运:)