使用德语字典和语言模型与Sphinx4

时间:2016-02-19 20:38:21

标签: cmusphinx sphinx4

我可以使用Sphinx4附带的en-us东西,没问题:

cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us")
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict")
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin")

我可以用它来录制英文录音文件。

现在我想在德语录音中使用它。在网站上,我找到了Acoustic and Language Models的链接。其中有一个档案'德国Voxforge'。我找到了声学模型路径的相应文件。但就我所见,它不包含字典或语言模型。

如何在Sphinx4中获取德语的字典和语言模型路径?

2 个答案:

答案 0 :(得分:5)

您自己创建它们。您可以从字幕或维基百科转储创建语言模型。文档为here

最新德国型号实际上不在CMUSphinx页面上,它们位于github/gooofy。在这个gooofy项目中,您可以找到字典文档,模型和相关的matherials。

答案 1 :(得分:0)

我已经尝试使用 pocketsphinx 的德语模型,并且由于* .lm.bin这个“无效”语言模型而出现了一些错误,所以我正在使用* lm.gz,它现在可以工作。

正确的列表是:

  • fst = voxforge-de.fst
  • hmm文件夹 = model_parameters / voxforge.cd_cont_6000
  • 词典 = cmusphinx-voxforge-de.dic
  • 语言模型 = cmusphinx-voxforge-de.lm.gz

要获取hmm路径,您应解压缩:cmusphinx-de-voxforge-5.2.tar.gz

我认为Sphinx4应该相同,因此可以尝试一下。