我使用Google Speech API使用Python识别.OGG文件音频中的越南语音。但它并没有回馈任何结果。
答案 0 :(得分:0)
至少在英文版的Google Speech API中,您需要使用FLAC输入文件或Linear 16输入文件(不是OGG音频格式)。
有关更多上下文,请参见此故障排除页面:https://cloud.google.com/speech-to-text/docs/troubleshooting
答案 1 :(得分:0)
尝试使用这个配置,对我来说使用 nodejs 工作
const config = {
encoding: 'OGG_OPUS',
sampleRateHertz: 16000,
languageCode: 'YOUR_LAUNGAGE CODE'
}
我正在处理 OGA 格式的电报音频文件