音频:在M4A和FLAC,WAV或原始

时间:2018-02-23 01:45:20

标签: python python-3.x audio

我正在处理通过Quicktime录制的音频并以.m4a格式保存。我想使用Google Cloud Provider的Speech API,他们的推荐是:

执行:

  

使用无损编解码器录制和传输音频。建议使用FLAC或LINEAR16。

避免:

  

在录制或传输过程中使用mp3,mp4,m4a,mu-law,a-law或其他有损编解码器可能会降低准确性。如果您的音频已经采用API不支持的编码,请将其转码为无损FLAC或LINEAR16。如果您的应用程序必须使用有损编解码器来节省带宽,我们建议您按首选顺序使用AMR_WB,OGG_OPUS或SPEEX_WITH_HEADER_BYTE编解码器。

来源:https://cloud.google.com/speech/docs/best-practices

API支持FLAC,WAV或raw,我试图以编程方式将我的文件转码为其中一个,以便在应用程序中使用。但是,我无法找到一个好的Python库来实现这一目标。

更新: 这里的答案是:https://www.ffmpeg.org/(不是python,但肯定是最全面的工具)

1 个答案:

答案 0 :(得分:5)

我正在使用python库调用pydub: pydub github link 它们建立在ffmpeg

之上