将.wav从音频段导出到AWS S3存储桶

时间:2019-04-17 20:51:25

标签: python django amazon-s3 ibm-cloud pydub

我正在使用IBM的Text-to-Speech API来运行扬声器检测。我使用pydub将多个.wav文件合并为一个,但是我无法将AudioSegment传递给IBM。

我的问题是:

  1. 我可以将文件直接导出到AWS S3存储桶,以便以后从那里检索吗?

  2. 我还能如何通过AudioSegment?我可以将其编码为变量的方式有所不同,以便在没有意义的情况下将其导出而不将其保存在内存中吗?

这是IBM可以阅读的格式

  • 应用程序/八位字节流
  • 音频/警报(必需。指定音频的采样率(速率)。)
  • 音频/基本(必需。仅用于窄带型号。)
  • 音频/ flac
  • audio / g729(仅用于窄带型号。)
  • 音频/ l16(必需。指定音频的采样率(速率),并可选地指定音频的通道数(通道)和字节序(字节序)。)
  • 音频/ mp3
  • 音频/ mpeg
  • 音频/ mulaw
  • 音频/音频
  • audio / ogg; codecs = opus
  • audio / ogg; codecs = vorbis
  • 音频/音频
  • 音频/ webm
  • audio / webm; codecs = opus
  • audio / webm; codecs = vorbis

我喜欢pydub,到目前为止,它是一个了不起的工具。谢谢你做到!

1 个答案:

答案 0 :(得分:0)

由于无论如何都在使用python,因此可以使用smart_open将对象存储区中的远程文件就像语言环境一样对待。这将允许您将文件的各个部分流式传输到os,而无需一次将所有部分都存储在内存中。任何格式都适合对象存储。