Question

我尝试过CMU Sphinx，它可以和美国英语一起使用。现在，我想使用CMU Sphinx来检测（印度口音）英语。我应该做些什么步骤/改变？

Answer 1

您需要做的是调整声学模型。查看CMU Sphinx维基页面，他们已经解释了训练和调整声学模型的过程。目前有效的链接：http://cmusphinx.sourceforge.net/wiki/

根据网站的说法，

CMUSphinx提供适应方式，足以满足大多数需要更高精度的情况。当你使用不同的录音环境（近距离或远麦克风或电话频道），或者有不同的重音（英国英语甚至是印度英语）或甚至是其他语言时，已知适应性能很好。

Answer 2

您还可以做的一件事是从此处下载经过预训练的文件：

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/

这些.tar.gz中的文件与我的lib版本中的结构有些不同，因此我必须按照以下链接中的步骤进行操作：

https://github.com/Uberi/speech_recognition/issues/192

我将展示我已经采取的步骤，基本上就是上面链接所说明的内容，但是它可能会死掉，所以就这样：

在我的计算机上（Ubuntu 18.04.4），词典保存在这里：

~/.local/lib/python2.7/site-packages/speech_recognition/pocketsphinx-data

在上述筛选器中，我有一个子文件夹en-US，其中有以下文件（F）和目录（D）：

D acoustic-model
F language-model.lm.bin
F LICENSE.txt
F pronounciation-dictionary.dict

因此，我下载了印度语言.tar.gz，使其看起来像en-US目录。像这样：

tar zxvf cmusphinx-en-in-8khz-5.2.tar.gz
mv cmusphinx-en-in-8khz-5.2 en-IN
cd en-IN
mv en-us.lm.bin language-model.lm.bin
mv en_in.dic pronounciation-dictionary.dict
mv en_in.cd_cont_5000 acoustic-model
cd ..

然后我将其移至正确的目录。

mv en-IN ~/.local/lib/python2.7/site-packages/speech_recognition/pocketsphinx-data

至此，我可以使用en-IN了。

CMU Sphinx为印度英语

2 个答案: