我正在尝试制作可以通过语音识别停止的闹钟Android应用程序。 为此,我正在使用Google语音识别API(+ this code来连续进行语音识别)。
它工作正常,直到我同时播放音乐。在这种情况下,语音识别的效率会降低。
这个问题是合乎逻辑的,因为音乐会增加一些噪音,使识别变得更难。但由于播放的音乐是众所周知的,我想知道是否有可能告诉谷歌试图忽略这些额外的噪音。我知道在信号处理中存在一些过滤器(如Kalman filter或Wiener filter)。
所以我的问题是: 是否可以应用具有Google语音识别功能的过滤器来忽略已知噪音?或者是否有其他语音识别库允许这样做?
编辑:这不是重复,因为问题不一样。但有趣的建议虽然。
答案 0 :(得分:1)
Google语音识别功能已经过优化,可以检测语音,无论背景环境噪音是什么类型'
而不是使用Google的原生语音识别功能,通过他们的“现在/助理”提供。应用程序,您可以使用提供一些增强功能的Cloud Speech API。
识别器旨在忽略背景声音和噪音 没有额外的噪音消除。但是,为了获得最佳效果, 特别是将麦克风定位在尽可能靠近用户的位置 当存在背景噪音时。
毫无疑问,上述语音识别系统无疑是正确的。
使用单词和短语提示为词汇表添加名称和术语 提高特定单词和短语的准确性。
对于简短查询或命令,请使用StreamingRecognize single_utterance设置为true。这简化了对优化的认可 话语也可以减少延迟。