应用错误收集

我正在处理通过Quicktime录制的音频并以.m4a格式保存。我想使用Google Cloud Provider的Speech API，他们的推荐是：

执行：

使用无损编解码器录制和传输音频。建议使用FLAC或LINEAR16。

避免：

在录制或传输过程中使用mp3，mp4，m4a，mu-law，a-law或其他有损编解码器可能会降低准确性。如果您的音频已经采用API不支持的编码，请将其转码为无损FLAC或LINEAR16。如果您的应用程序必须使用有损编解码器来节省带宽，我们建议您按首选顺序使用AMR_WB，OGG_OPUS或SPEEX_WITH_HEADER_BYTE编解码器。

来源：https://cloud.google.com/speech/docs/best-practices

API支持FLAC，WAV或raw，我试图以编程方式将我的文件转码为其中一个，以便在应用程序中使用。但是，我无法找到一个好的Python库来实现这一目标。

更新：这里的答案是：https://www.ffmpeg.org/（不是python，但肯定是最全面的工具）

音频：在M4A和FLAC，WAV或原始

1 个答案: