android:语音识别有哪些技术可用

时间:2012-04-19 07:30:43

标签: android speech-recognition

我是android中“语音识别”领域的新手。

我的应用中要求“语音识别”。所以我正在做作业。 我找到 1. android SDK支持这个,它使用了“谷歌语音识别” 因此,根据我所理解的天气,我们通过意图调用识别器,或者我们使用SpeechRecogniser类,实际的识别是在谷歌云服务器上完成的。 我尝试了使用这两种方法的示例应用程序,在这两种情况下匹配率非常低 (首先是我的发现是对的?我试过的大多数单词/句子都没有得到正确的匹配。)

  1. 这两种方法的输出是否有任何差异,即通过意图/或使用SpeechRecogniser类启动)

  2. 是否所有应用都依赖于此Google技术,其中语音作为声音字节发送并在云端服务器上识别。我看到Shazam使用了不同的技术,但他们有自己的数据库。是否使用过其他技术

  3. 我看到很多“siri for android”。关于这些应用程序如何实际运作的任何说明?

  4. 非常感谢你的时间和帮助。

2 个答案:

答案 0 :(得分:2)

1)使用RecognizerIntentSpeechRecognizer时,您会得到相同的结果。主要区别在于用户交互。 RecognizerIntent强制用户通过标准语音识别程序。使用SpeechRecognizer,您可以控制应用收集语音的方式以及处理语音的时间。 RecognizerIntent的优点是用户可以轻松编程和熟悉。使用SpeechRecognizer,您可以实现高级内容,例如在后台收听语音。您还可以获得更好的错误报告。

此外,识别器很容易理解一些像“苹果”这样的词,但有些词很难像“孜然”那样出于各种原因。你必须聪明地匹配google返回以实现可靠的东西。

2)我不确定你自己的数据库是什么意思。您的应用程序将有一个“数据库”,您尝试与用户所说的匹配

3)可能混合使用自然语言处理,用户建模,模拟人类对话的技巧。或者它们只是一大堆手工编码规则,使它们看起来很聪明。我的想法是尝试制作可信的东西需要做很多工作。

在这里查看我的一些示例代码: https://github.com/gmilette/Say-the-Magic-Word-

答案 1 :(得分:1)