我想像应用程序一样构建用于听写的语音识别系统。我阅读了htk书和其他教程,但所有教程都是用于命令和控制的应用程序。对于那些应用程序,命令集,单词限制,并使用任务语法(gram
文件)手动指定。
在我的应用程序中,无法指定这样的语法,因为我将处理包含两个人之间对话的大量音频文件。
所以我想知道是否可以使用htk构建这样的应用程序。
...谢谢
花了很多次睡眠后更新
使用Sphinx,我获得了86%的准确率。语言模型存在一些问题(我不确切地知道它有什么问题,我试图找出它)所以我使用Sphinx lmtool
创建了新的语言模型,这是一个基于Web的语言模型生成服务。您可以使用this link
另外,我已将声学模型从HUB更改为WSJ。