Question

我正在尝试将音频文件导出到LINEAR16 for Google Speech，我注意到它们指定了little-endian字节顺序。我正在使用pydub导出为“原始”格式，但我无法从文档（或源代码）判断导出的文件是以小端还是大端格式？我正在使用以下命令进行导出：

audio = pydub.from_file(self.mFilePathName, "mp4")
fullFileNameRaw = "audio.raw"
audio.export(fullFileNameRaw, format='raw')

谢谢。 -K

Answer 1

根据this answer，标准（RIFF）波形文件是小端。 Pydub使用stdlib wave模块来编写wave文件，因此我猜测它是小端。（如果您使用波形标题编写文件，它实际上在开头就有RIFF。）

进一步研究它，似乎它可能取决于硬件平台的字节顺序。 x86和AMD64都是小端，但基本上涵盖了人们运行pydub的所有地方（我想？）