我正在处理通过Quicktime录制的音频并以.m4a格式保存。我想使用Google Cloud Provider的Speech API,他们的推荐是:
执行:
使用无损编解码器录制和传输音频。建议使用FLAC或LINEAR16。
避免:
在录制或传输过程中使用mp3,mp4,m4a,mu-law,a-law或其他有损编解码器可能会降低准确性。如果您的音频已经采用API不支持的编码,请将其转码为无损FLAC或LINEAR16。如果您的应用程序必须使用有损编解码器来节省带宽,我们建议您按首选顺序使用AMR_WB,OGG_OPUS或SPEEX_WITH_HEADER_BYTE编解码器。
来源:https://cloud.google.com/speech/docs/best-practices
API支持FLAC,WAV或raw,我试图以编程方式将我的文件转码为其中一个,以便在应用程序中使用。但是,我无法找到一个好的Python库来实现这一目标。
更新: 这里的答案是:https://www.ffmpeg.org/(不是python,但肯定是最全面的工具)