我试图在嵌入式设备上运行Pocketsphinx。不幸的是,它不起作用,我想我在关于该应用程序的常见问题解答(https://cmusphinx.github.io/wiki/faq/)中找到了原因
问:我可以在移动设备/ Raspberry PI上运行大词汇量语音识别吗?
不,您不能。对于大型词汇语音识别,CPU太慢。手机CPU通常比台式机慢9倍。词汇量不受限制的语音识别需要非常大的计算和内存资源(数TB的内存),因此很难在其他嵌入式设备上的iPhone中做到这一点。 iPad更容易。
Google付出了巨大的努力,以使其引擎脱机运行以听写,但它仍然更愿意将数据发送到服务器,因为它的准确性大大提高。
因为在小型设备上运行的大多数解决方案使用的词汇量有限。尽管此词汇表可能足够大,所以您不会注意到这一点。通常500-1000个单词足以覆盖大多数实际情况。
要训练语言模型,您需要来自您域的文本(单词和表达式)。教程中介绍了语言模型训练。
我的问题是,您是否知道一些字典小到足以胜任这项工作,或者我如何从较大的字典中生成这样的东西?预先感谢