应用错误收集

android：语音识别有哪些技术可用

时间：2012-04-19 07:30:43

标签： android speech-recognition

我是android中“语音识别”领域的新手。

我的应用中要求“语音识别”。所以我正在做作业。我找到 1. android SDK支持这个，它使用了“谷歌语音识别” 因此，根据我所理解的天气，我们通过意图调用识别器，或者我们使用SpeechRecogniser类，实际的识别是在谷歌云服务器上完成的。我尝试了使用这两种方法的示例应用程序，在这两种情况下匹配率非常低（首先是我的发现是对的？我试过的大多数单词/句子都没有得到正确的匹配。）

这两种方法的输出是否有任何差异，即通过意图/或使用SpeechRecogniser类启动）
是否所有应用都依赖于此Google技术，其中语音作为声音字节发送并在云端服务器上识别。我看到Shazam使用了不同的技术，但他们有自己的数据库。是否使用过其他技术
我看到很多“siri for android”。关于这些应用程序如何实际运作的任何说明？

非常感谢你的时间和帮助。

2 个答案:

答案 0 :(得分：2)

1）使用RecognizerIntent或SpeechRecognizer时，您会得到相同的结果。主要区别在于用户交互。 RecognizerIntent强制用户通过标准语音识别程序。使用SpeechRecognizer，您可以控制应用收集语音的方式以及处理语音的时间。 RecognizerIntent的优点是用户可以轻松编程和熟悉。使用SpeechRecognizer，您可以实现高级内容，例如在后台收听语音。您还可以获得更好的错误报告。

此外，识别器很容易理解一些像“苹果”这样的词，但有些词很难像“孜然”那样出于各种原因。你必须聪明地匹配google返回以实现可靠的东西。

2）我不确定你自己的数据库是什么意思。您的应用程序将有一个“数据库”，您尝试与用户所说的匹配

3）可能混合使用自然语言处理，用户建模，模拟人类对话的技巧。或者它们只是一大堆手工编码规则，使它们看起来很聪明。我的想法是尝试制作可信的东西需要做很多工作。

在这里查看我的一些示例代码： https://github.com/gmilette/Say-the-Magic-Word-

答案 1 :(得分：1)

是的....你在正确的轨道上。 Here is a good Artical on Speech Recognization。我认为you also find Some informatoion on this link和this is interesting for you!