Google Speech API不接受大型音频文件

时间:2018-07-27 18:58:27

标签: google-cloud-speech

尝试处理大型音频文件时,我收到服务器错误。音频文件最初是音频/ m4a @ 32kHz,并且按照文档的建议将其转换/压缩为音频/ amr_wb @ 16kHz。这些文件远低于180分钟的音频限制,但是在处理它们时我仍然收到服务器错误。

GaxError Exception occurred in retry method that was not classified as transient, caused by 8:Received message larger than max (5371623 vs. 4194304)

我正在使用版本V1p1beta和方法long_running_recognize来转录这些音频文件。我的文件托管在Google Cloud Storage上,并且在api调用中提供了uri。

如何在服务器不执行大小限制的情况下将大型音频文件发送到API?如果服务器甚至无法处理编码为AMR_WB的长达一小时的音频文件,建议使用FLAC或WAV并限制音频时间为180分钟似乎是错误的。

感谢您的帮助

1 个答案:

答案 0 :(得分:0)

当前,语音文本API已发布v1 endpoint,建议您尝试使用此版本。通过使用90分钟的音频,我得到了正确的答复。