我正在用目标C / C ++构建iOS语音识别应用程序,以纠正说话人的发音。
我正在使用Mel-Frequency-Cepstrum Coefficients
并使用DTW.
匹配两个声波
如果我错了,请纠正我。
现在我想知道句子中的哪个单词(两个声音文件)不匹配。
例如我的两个声音文件说话
1. I live in New York.
2. I laav in New York.
我的算法应该通过某种指示来指出第二个词。
我使用了Match-Box开放库供参考。这是它的link。 欢迎使用任何新算法或任何新库。
PS. I don't want to use text to speech synthesis and speaker recognition.
如果我在错误的地方发布了问题,请指导我找到合适的资源。
也欢迎任何小提示。