语音识别语言模型

时间:2010-10-14 11:20:42

标签: android speech-recognition

我想将语音识别集成到我的Android应用程序中。

我知道谷歌提供两种语言模式(免费形式的听写和网络搜索短语)。

但是,我的应用程序将包含有限数量的可能单词(可能是几千)。是否可以指定词汇表;将其限制在这些词语中,希望能够获得更准确的结果吗?

我的直接想法是使用网络搜索语言模型,然后根据我的词汇检查结果。

任何想法都赞赏。

3 个答案:

答案 0 :(得分:1)

我认为你的直觉是正确的,你已经回答了自己的问题。

谷歌提供的内置语音识别仅支持听写和搜索语言模型。见http://developer.android.com/reference/android/speech/RecognizerIntent.html

您可以使用这些识别器模型获取结果,然后对结果进行分类或过滤,以找到最有效的词汇量。有不同的技术可以做到这一点,它们的范围从简单的解析到复杂的统计模型。

我见过的唯一其他选择是在可以接受您的专用语言模型的服务器上使用其他语音识别。虽然这是昂贵且复杂的,并且被VLingo或Dragon或微软的Bing等商业语音公司使用。

答案 1 :(得分:0)

您可以使用像Voxforge这样的Opensource模型或者像Lumenvox这样的廉价模型。 有些已被移植到android。我忘记了谁。

答案 2 :(得分:0)

之前我回答过几乎相同的问题 - 请点击此处:Building openears compatible language model

在这里:

通常您需要非常大的文本语料库来生成有用的语言模型。

如果您只有少量的训练数据,您的语言模型将会过度拟合,这意味着它不会一概而论。