如何在Pocketsphinx中减小字典的大小?

时间:2019-04-15 09:21:22

标签: pocketsphinx

我试图在嵌入式设备上运行Pocketsphinx。不幸的是,它不起作用,我想我在关于该应用程序的常见问题解答(https://cmusphinx.github.io/wiki/faq/)中找到了原因

  

问:我可以在移动设备/ Raspberry PI上运行大词汇量语音识别吗?

     

不,您不能。对于大型词汇语音识别,CPU太慢。手机CPU通常比台式机慢9倍。词汇量不受限制的语音识别需要非常大的计算和内存资源(数TB的内存),因此很难在其他嵌入式设备上的iPhone中做到这一点。 iPad更容易。

     

Google付出了巨大的努力,以使其引擎脱机运行以听写,但它仍然更愿意将数据发送到服务器,因为它的准确性大大提高。

     

因为在小型设备上运行的大多数解决方案使用的词汇量有限。尽管此词汇表可能足够大,所以您不会注意到这一点。通常500-1000个单词足以覆盖大多数实际情况。

     

要训练语言模型,您需要来自您域的文本(单词和表达式)。教程中介绍了语言模型训练。

我的问题是,您是否知道一些字典小到足以胜任这项工作,或者我如何从较大的字典中生成这样的东西?预先感谢

0 个答案:

没有答案