我尝试过CMU Sphinx,它可以和美国英语一起使用。现在,我想使用CMU Sphinx来检测(印度口音)英语。我应该做些什么步骤/改变?
答案 0 :(得分:1)
您需要做的是调整声学模型。查看CMU Sphinx维基页面,他们已经解释了训练和调整声学模型的过程。目前有效的链接:http://cmusphinx.sourceforge.net/wiki/
根据网站的说法,
CMUSphinx提供适应方式,足以满足大多数需要更高精度的情况。当你使用不同的录音环境(近距离或远麦克风或电话频道),或者有不同的重音(英国英语甚至是印度英语)或甚至是其他语言时,已知适应性能很好。
答案 1 :(得分:0)
您还可以做的一件事是从此处下载经过预训练的文件:
https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/
这些.tar.gz中的文件与我的lib版本中的结构有些不同,因此我必须按照以下链接中的步骤进行操作:
https://github.com/Uberi/speech_recognition/issues/192
我将展示我已经采取的步骤,基本上就是上面链接所说明的内容,但是它可能会死掉,所以就这样:
在我的计算机上(Ubuntu 18.04.4),词典保存在这里:
~/.local/lib/python2.7/site-packages/speech_recognition/pocketsphinx-data
在上述筛选器中,我有一个子文件夹en-US,其中有以下文件(F)和目录(D):
D acoustic-model
F language-model.lm.bin
F LICENSE.txt
F pronounciation-dictionary.dict
因此,我下载了印度语言.tar.gz,使其看起来像en-US目录。像这样:
tar zxvf cmusphinx-en-in-8khz-5.2.tar.gz
mv cmusphinx-en-in-8khz-5.2 en-IN
cd en-IN
mv en-us.lm.bin language-model.lm.bin
mv en_in.dic pronounciation-dictionary.dict
mv en_in.cd_cont_5000 acoustic-model
cd ..
然后我将其移至正确的目录。
mv en-IN ~/.local/lib/python2.7/site-packages/speech_recognition/pocketsphinx-data
至此,我可以使用en-IN了。