我正在寻找一些能让我在Android应用程序中创建离线语音识别的库。对于我的应用,将会有简单词汇表,最多包含15个短(一个字)命令。在我的情况下,响应时间至关重要。
是否有可行的离线选项(免费和付费)?我知道Sphinx的离线版本,但它会是最快的响应选项(同样,我只需要我的应用程序识别几个命令而不是整个语音到文本功能)?
答案 0 :(得分:5)
我已成功使用PocketSphinx进行此类应用。我建议构建PocketSphinx Demo应用,使用在线sphinx lmtool构建您的短命令列表的语言模型,看看它是否满足您的响应时间需求。如果onResults
回调速度不够快,您可以使用几乎立即返回的onPartialResults
回调 - 这就是我所做的,我对性能感到满意。该演示应用程序在UI中也有一个内置的计时器。
如果您使用在线lmtool,则可以从其生成的文件中获取lm
文件和dict
文件,使用这些文件替换相应的lm
和他们在演示设置说明中指出的语言模型中的dict
个文件。
建造它有点痛苦,但这是我第一次使用NDK,这很挑剔。
答案 1 :(得分:1)
点击此链接:http://en.wikipedia.org/wiki/List_of_speech_recognition_software
它列出了许多库和软件,处理语音/语音识别/合成。
小心..
答案 2 :(得分:0)
您在寻找关键字定位软件吗? sensoryinc.com多年来一直这样做,而且最近才制作了一些Android应用。这是一个我正在驾驶并希望使用语音触发器来录制音频音符的示例。只有在我说“hello blue genie”之后才会开始录制我的音频笔记。 http://vimeo.com/64658273 (不,我不为Sensory工作,但我认为他们的技术被大大低估了)