Google Speech API:可以识别来自OGG文件的语音

时间:2017-08-01 13:31:43

标签: speech-recognition google-speech-api

我使用Google Speech API使用Python识别.OGG文件音频中的越南语音。但它并没有回馈任何结果。

2 个答案:

答案 0 :(得分:0)

至少在英文版的Google Speech API中,您需要使用FLAC输入文件或Linear 16输入文件(不是OGG音频格式)。

有关更多上下文,请参见此故障排除页面:https://cloud.google.com/speech-to-text/docs/troubleshooting

答案 1 :(得分:0)

尝试使用这个配置,对我来说使用 nodejs 工作

const config = {
  encoding: 'OGG_OPUS',
  sampleRateHertz: 16000,
  languageCode: 'YOUR_LAUNGAGE CODE'
}

我正在处理 OGA 格式的电报音频文件