我想将sphinx4用于通用语音识别,例如你告诉应用程序的东西,它打印你说的。然而,当我浏览这些例子时,所有关于识别非常少量的词汇。是否有任何好的教程可帮助配置它以识别更具挑战性的内容,例如两个人之间的对话?
PS:我相信sphinx4已经有正确的声学模型和词典,但lm
文件适用于特定的应用程序,所以我需要一个lm
文件,对吗?
答案 0 :(得分:1)
然而,当我浏览这些例子时,所有关于识别词汇量非常少的问题。是否有任何好的教程可帮助配置它以识别更具挑战性的内容,例如:两个人之间的对话。
您无需配置sphinx4。您可以从subversion中查看最新版本并按原样使用该演示,有关详细信息,请参阅教程
http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4
当我相信sphinx4已包含正确的声学模型和词典时,但lm文件是针对特定应用程序的,所以我需要一个lm文件,我是否正确?
提供的默认lm文件足以支持通用语音,但是,如果您有特定的域,则创建特定于域的语言模型是有意义的。