使用谷歌语音识别时忽略背景音乐

时间:2018-01-27 11:46:03

标签: android voice-recognition

我正在尝试制作可以通过语音识别停止的闹钟Android应用程序。 为此,我正在使用Google语音识别API(+ this code来连续进行语音识别)。

它工作正常,直到我同时播放音乐。在这种情况下,语音识别的效率会降低。

这个问题是合乎逻辑的,因为音乐会增加一些噪音,使识别变得更难。但由于播放的音乐是众所周知的,我想知道是否有可能告诉谷歌试图忽略这些额外的噪音。我知道在信号处理中存在一些过滤器(如Kalman filterWiener filter)。

所以我的问题是: 是否可以应用具有Google语音识别功能的过滤器来忽略已知噪音?或者是否有其他语音识别库允许这样做?

编辑:这不是重复,因为问题不一样。但有趣的建议虽然。

1 个答案:

答案 0 :(得分:1)

Google语音识别功能已经过优化,可以检测语音,无论背景环境噪音是什么类型'

而不是使用Google的原生语音识别功能,通过他们的“现在/助理”提供。应用程序,您可以使用提供一些增强功能的Cloud Speech API

  

识别器旨在忽略背景声音和噪音   没有额外的噪音消除。但是,为了获得最佳效果,   特别是将麦克风定位在尽可能靠近用户的位置   当存在背景噪音时。

毫无疑问,上述语音识别系统无疑是正确的。

  

使用单词和短语提示为词汇表添加名称和术语   提高特定单词和短语的准确性。

     

对于简短查询或命令,请使用StreamingRecognize   single_utterance设置为true。这简化了对优化的认可   话语也可以减少延迟。

https://cloud.google.com/speech/docs/best-practices