Sphinx4找出正确的模型

时间:2015-01-20 03:51:14

标签: cmusphinx sphinx4

我正在尝试使用Sphinx4库进行语音识别,但我似乎无法弄清楚声学模型 - 词典 - 语言模型的正确组合。我尝试了各种组合,每次都会出现不同的错误。

我正在尝试按照http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4上的教程。我没有像我使用ConfigurationManager而不是Configuration那样的config.xml,因为没有可感知的方法将配置文件的位置传递给Configuration本身(ConfigMgr将其作为构造函数的参数);那可能是我的问题。我只是不知道如何指向一个,因为教程说“可以通过XML文件配置应用程序的低级组件,尽管你应该只在你理解发生了什么时才这样做。”,我假设拥有config.xml文件不是强制性的。

将最新的词典(7b - 从Sourceforge获得)与最新的声学模型(cmusphinx-en-us-5.2.tar.gz - 再次来自SF)和语言模型(cmusphinx-5.0-en-us.lm)相结合.gz - 再次来自SF)会在NullPointerException中产生startRecognition。问题类似于此处的问题:sphinx-4 NullPointerException at startRecognition,但答案中给出的链接不再有效。我从SF获得了0.7a(因为这是链接似乎指向的dict),但是当我使用那个时,我在执行Error loading word: ;;;时甚至更早。我尝试从Github仓库下载最新的模型和dict,结果是java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128

非常感谢任何帮助!

1 个答案:

答案 0 :(得分:0)

您需要使用github的最新代码

http://github.com/cmusphinx/sphinx4

如教程

所述

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

已包含正确的型号(en-us),您不应更换任何内容。您不应该配置任何XML文件,使用源中提供的示例。