如何为CMU Sphinx创建语音语言模型?

时间:2017-03-15 12:37:17

标签: speech-recognition voice-recognition cmusphinx

我需要为俄语制作语音识别。我按照project page的教程。

在教程中我看到了

  

您可以使用语音字典为您的语言转换文本,将其转换为语音字符串。只需用相应的转录替换单词即可。由于手机的数量很少,文字也不应该很大,只是一本书就可以了。

但在哪里可以找到拼音字典?我如何用整本书中的相应转录替换这些单词?

或者......我能在哪里找到完整的语音模型?

已更新

我用line:

创建了文件test.txt

SIL i0 lj j a1 i1 lj f j e0 v gj e1 nj i0 j pj e0 t r o1 v z o0 l o o t o 1 j tj e0 lj o1 n o0 k SIL

这是线形式测试wav文件,将替换的俄语单词替换为拼音表示字典(ru.dic)。

然后我使用SRILM使用命令构建模式:

ngram-count -interpolate -t​​ext test.txt -lm test.phonetic.lm

接下来我用命令启动它:

pocketsphinx \ bin \ Debug \ Win32 \ pocketsphinx_continuous.exe -samprate 16000 -allphone testModel \ test.phonetic.lm -hmm cmusphinx-ru-5.2 -remove_noise no -infile testModel \ decoder-test.wav -backtrace是

但是当我使用它时,我发现错误的手机有错误的结果。

1 个答案:

答案 0 :(得分:0)

  

但在哪里可以找到拼音字典?

中的文件ru.dic

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/Russian/cmusphinx-ru-5.2.tar.gz/download

  

如何在整本书中用相应的转录替换这些单词?

使用Python中的脚本

  

或者......我能在哪里找到完整的语音模型?

你必须自己创建它。