我们可以像应用程序一样使用htk进行听写吗?

时间:2013-03-11 07:30:05

标签: speech-recognition htk dictation

我想像应用程序一样构建用于听写的语音识别系统。我阅读了htk书和其他教程,但所有教程都是用于命令和控制的应用程序。对于那些应用程序,命令集,单词限制,并使用任务语法(gram文件)手动指定。

在我的应用程序中,无法指定这样的语法,因为我将处理包含两个人之间对话的大量音频文件。

所以我想知道是否可以使用htk构建这样的应用程序。

...谢谢


花了很多次睡眠后更新

使用Sphinx,我获得了86%的准确率。语言模型存在一些问题(我不确切地知道它有什么问题,我试图找出它)所以我使用Sphinx lmtool创建了新的语言模型,这是一个基于Web的语言模型生成服务。您可以使用this link

来获取它

另外,我已将声学模型从HUB更改为WSJ。

1 个答案:

答案 0 :(得分:2)

是的,你可以。为此目的有两个解码器:

ATK

Julius

两者都要求您为大词汇量语音识别提供语言模型

我还建议您查看CMUSphinx哪个更容易使用