我是语音识别的新手,android和我有一个用例,我需要构建一个Android应用程序,它从用户获取命令(有限的命令集,少于100)并执行一些逻辑。我用google搜索了一下,发现以下内容可以完成
有人可以建议我上面哪一项最适合我的用例? 我有一套有限的命令,速度对我来说最重要。
我真的很困惑,因此提出了这个问题。提前谢谢。
答案 0 :(得分:1)
使用google cloud speech api
非常昂贵,因为您必须为每个请求付费。
使用Android内置语音到文本功能(它与谷歌云语音API不同吗?如果是这样的话?)。使用Android语音离线模式对文本有什么优缺点?
内置API可以使用。它与云API不同,它是免费的。但它不能透明地为用户脱机工作。不好的一面很慢,你无法配置词汇。因此它将解码所有单词而不是某些特定的命令集,并且通常会将所需的命令与噪声中的其他单词混淆。
使用开源语音识别库,如Kaldi,CMU Sphinx(看起来他们需要花费大量精力收集和训练数据)
正确的发展始终是一种努力。