我正在使用IBM的Text-to-Speech API来运行扬声器检测。我使用pydub将多个.wav文件合并为一个,但是我无法将AudioSegment传递给IBM。
我的问题是:
我可以将文件直接导出到AWS S3存储桶,以便以后从那里检索吗?
我还能如何通过AudioSegment?我可以将其编码为变量的方式有所不同,以便在没有意义的情况下将其导出而不将其保存在内存中吗?
这是IBM可以阅读的格式
我喜欢pydub,到目前为止,它是一个了不起的工具。谢谢你做到!
答案 0 :(得分:0)
由于无论如何都在使用python,因此可以使用smart_open将对象存储区中的远程文件就像语言环境一样对待。这将允许您将文件的各个部分流式传输到os,而无需一次将所有部分都存储在内存中。任何格式都适合对象存储。