使用pydub为Google语音导出音频

时间:2017-02-10 08:04:47

标签: python audio google-speech-api pydub google-cloud-speech

我正在尝试将音频文件导出到LINEAR16 for Google Speech,我注意到它们指定了little-endian字节顺序。我正在使用pydub导出为“原始”格式,但我无法从文档(或源代码)判断导出的文件是以小端还是大端格式? 我正在使用以下命令进行导出:

audio = pydub.from_file(self.mFilePathName, "mp4")
fullFileNameRaw = "audio.raw"
audio.export(fullFileNameRaw, format='raw')

谢谢。 -K

1 个答案:

答案 0 :(得分:0)

根据this answer,标准(RIFF)波形文件是小端。 Pydub使用stdlib wave模块来编写wave文件,因此我猜测它是小端。 (如果您使用波形标题编写文件,它实际上在开头就有RIFF。)

进一步研究它,似乎它可能取决于硬件平台的字节顺序。 x86和AMD64都是小端,但基本上涵盖了人们运行pydub的所有地方(我想?)