我正在尝试使用Sphinx4库进行语音识别,但我似乎无法弄清楚声学模型 - 词典 - 语言模型的正确组合。我尝试了各种组合,每次都会出现不同的错误。
我正在尝试按照http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4上的教程。我没有像我使用ConfigurationManager而不是Configuration那样的config.xml,因为没有可感知的方法将配置文件的位置传递给Configuration本身(ConfigMgr将其作为构造函数的参数);那可能是我的问题。我只是不知道如何指向一个,因为教程说“可以通过XML文件配置应用程序的低级组件,尽管你应该只在你理解发生了什么时才这样做。”,我假设拥有config.xml文件不是强制性的。
将最新的词典(7b - 从Sourceforge获得)与最新的声学模型(cmusphinx-en-us-5.2.tar.gz - 再次来自SF)和语言模型(cmusphinx-5.0-en-us.lm)相结合.gz - 再次来自SF)会在NullPointerException
中产生startRecognition
。问题类似于此处的问题:sphinx-4 NullPointerException at startRecognition,但答案中给出的链接不再有效。我从SF获得了0.7a(因为这是链接似乎指向的dict),但是当我使用那个时,我在执行Error loading word: ;;;
时甚至更早。我尝试从Github仓库下载最新的模型和dict,结果是java.lang.IndexOutOfBoundsException: Index: 16128, Size: 16128
。
非常感谢任何帮助!
答案 0 :(得分:0)
您需要使用github的最新代码
http://github.com/cmusphinx/sphinx4
如教程
所述http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4
已包含正确的型号(en-us),您不应更换任何内容。您不应该配置任何XML文件,使用源中提供的示例。