在android语音输入识别器中预处理音频

时间:2012-05-13 14:07:46

标签: android speech-recognition audio-processing

我正在做一些基本的命令识别并使用Google搜索输入API。但是我想自己捕获音频,预处理音频(去噪,增强幅度等),将这些修改后的音频发送到识别器并获得结果。有可能吗?

我知道您可以使用SpeechRecognizerRecognitionListener来使用onBufferReceived方法获取音频。但是,我想进行预处理而不是后处理。是否有任何解决方法/黑客可以为谷歌识别器提供处理过的数据?

1 个答案:

答案 0 :(得分:0)

  

预处理音频(去噪,增强幅度等),将修改后的音频发送到识别器并获得结果

通常语音识别系统会受此影响。错误实现的去噪会降低语音识别的准确性,因为它会以不可预测的方式破坏频谱。幅度提升并没有帮助,因为幅度在语音识别的最初阶段被标准化。你的预处理只会受到伤害。

如果您仍想尝试,请尝试获得pocketsphinx

http://cmusphinx.sourceforge.net/2011/05/building-pocketsphinx-on-android/