我在Raspbian上尝试Jasper。根据{{3}},以及PocketSphinx,我们还必须安装CMUCLMTK,MIT语言建模工具包,m2m-aligner,OpenFST和Phonetisaurus。
安装PocketSphinx后,安装所有这些依赖项之前,我使用pocketsphinx_continuous
来测试语音识别。无论准确性如何,它显然能够捕获我的演讲并完成解释过程。我甚至使用CMU Jasper docs创建了自己的.lm
和.dict
个文件,并在pocketsphinx_continuous
上尝试了它们没有问题。
我的问题是: PocketSphinx似乎能够在没有所有依赖项的情况下执行语音识别。 Jasper为什么要告诉我安装它们? PocketSphinx真的需要它们吗?他们的目的是什么?
答案 0 :(得分:2)
在此列表中,不需要至少2个。 CMUCLMTK和MITLM都是具有相同功能的语言建模工具包。即使您想要替换在线lmtool,您也只需要其中一个。同样,Phonetisaurus只需要MITLM和m2m-aligner来训练g2p模型,而不是使用它们。
理想情况下,您只需要MITLM,OpenFST和phonetisaurus来替换在线lmtool并在本地添加新单词。您不需要CMUCLMTK和m2m-aligner。
将来Pocketsphinx将能够使用没有Phonetisaurus的新单词,因此您可以放弃这种依赖。
如果Jasper开发人员仍然可以投诉,你需要向他们投诉。
答案 1 :(得分:2)
CMUCLMTK,MITLM,m2m-aligner,OpenFST和Phonetisaurus不是PocketSphinx依赖项,而且不是PocketSphinx所必需的。
Jasper使用CMUCLMTK编译语言模型(.lm)。
Phonetisaurus依赖于OpenFST Lib。
Jasper使用Phonetisaurus编译Dictionary(.dict)。
Jasper没有使用MITLM和m2m-aligner。
MITLM,m2m-aligner(仅一次)和从语料库编译G2P(FST)模型所需的OpenFST。