如何使用预处理

时间:2018-02-22 05:23:20

标签: google-cloud-speech

当我尝试谷歌语音识别时,它会在具有背景噪音的传统中文音频文件上显示低性能。经过一些预处理(如语音增强)后,我可以提高语音识别的性能吗?它适用于谷歌语音服务吗?

2 个答案:

答案 0 :(得分:2)

我建议您浏览Google云语音文档中的this页面,其中概述了如何向服务提供语音数据的最佳做法,包括预处理建议。

答案 1 :(得分:1)

使录音尽可能靠近原始语音信号。无失真,无削波,无噪声,无人工预处理,例如噪声抑制和自动增益控制。我认为这种预处理会破坏语音信号中的有用信息。

我从Google复制了关键点,然后将其粘贴如下。

  1. 将麦克风放置在离讲话者尽可能近的位置,尤其是在存在背景噪音的情况下。
  2. 避免音频剪辑。
  3. 请勿使用自动增益控制(AGC)。
  4. 应禁用所有降噪处理。
  5. 听一些示例音频。它听起来应该清晰,没有失真或意外的噪声。