选择语音apis的建议

时间:2017-10-03 16:44:30

标签: android speech-recognition speech-to-text speech google-speech-api

我是语音识别的新手,android和我有一个用例,我需要构建一个Android应用程序,它从用户获取命令(有限的命令集,少于100)并执行一些逻辑。我用google搜索了一下,发现以下内容可以完成

  1. 使用google cloud speech api
  2. 使用Android内置语音到文本功能(它与谷歌云语音API不同吗?如果是这样的话?)。使用Android语音的离线模式对文本有什么优缺点?
  3. 使用开源语音识别库,如Kaldi,CMU Sphinx(看起来他们需要花费大量精力收集和训练数据)
  4. 有人可以建议我上面哪一项最适合我的用例? 我有一套有限的命令,速度对我来说最重要。

    我真的很困惑,因此提出了这个问题。提前谢谢。

1 个答案:

答案 0 :(得分:1)

  

使用google cloud speech api

非常昂贵,因为您必须为每个请求付费。

  

使用Android内置语音到文本功能(它与谷歌云语音API不同吗?如果是这样的话?)。使用Android语音离线模式对文本有什么优缺点?

内置API可以使用。它与云API不同,它是免费的。但它不能透明地为用户脱机工作。不好的一面很慢,你无法配置词汇。因此它将解码所有单词而不是某些特定的命令集,并且通常会将所需的命令与噪声中的其他单词混淆。

  

使用开源语音识别库,如Kaldi,CMU Sphinx(看起来他们需要花费大量精力收集和训练数据)

正确的发展始终是一种努力。