我正在开发涉及Android上语音识别的项目。我有一些问题没有明确的答案在这个网站上(或任何,实际上)。我需要做一些类似于语音的文本,问题是我需要它不断工作,想象一个在背景上运行的应用程序,并在txt上写下它听到的一切。我知道我需要纠正很多"噪音听力",但它会在以后来......
我正在使用pocketsphinx-android,并尝试按照本教程: http://cmusphinx.sourceforge.net/wiki/tutorialandroid
问题出现在我尝试进行连续识别时,因为教程只显示搜索单词的步骤 - 取自教程:"关键字激活搜索"和#34;基于语法的搜索"和"语言模型搜索"。这是我第一次接受演讲,我很失落,所以如果有人可以给我一个指示,那将会很棒!
答案 0 :(得分:0)
如果你想用Android识别大词汇量,你需要"语言模型搜索"。您可以使用通用语言模型来识别语音而不受约束:
然而,这将是相当资源密集的过程,如果没有专业化,准确性将不会很好,您将不得不修剪模型以使其适合在移动设备上进行解码。因此,您的另一个选择是将音频流式传输到某些服务器,您可以使用更强大的模型识别它,或者只使用现有的API进行语音识别,从而实现连续解码。