Google Cloud中的音频编码,采样率和重新编码

时间:2018-12-18 15:30:18

标签: encoding gcloud google-speech-api sox

是否可以在无需下载的情况下查找存储在Google Cloud中的文件的音频元数据?构建Google Speech-to-Text API服务时,您将其传递给gs://bucket/file.flac,并且我知道soxffmpeg bash和Python命令可用于本地存储的文件元数据查找,但是我可以似乎没有找到在Google Cloud Storage文件中查找音频文件元数据的方法。

如果我有gs://bucket/audio.wav,是否可以使用sox / py-sox重新编码并将新的audio.flac直接写入gs://bucket/audio.flac?还是我必须下载audio.wav才能对其重新编码?

任何想法或指示都会受到赞赏。

1 个答案:

答案 0 :(得分:0)

否,无法直接在Google Cloud Storage中访问所需的元数据。使用命令gsutil ls -L gs://[bucket_name]/[file_name]将在存储桶中提示该文件的元数据。您可以modify these metadata,但不能指的是py-sox。您需要下载文件,对其重新编码,然后再次上传。

您无法在Cloud Storage中进行重新编码操作,您需要先下载文件并按所需方式对其进行处理,然后再将其重新上传到存储桶中。但是,如果可以的话,这是一种解决方法:

创建上传文件时触发的Cloud Function。然后,检索刚刚上传的文件并对其执行所需的任何操作(例如重新编码为.flac)。之后,再次上传(小心!如果为新文件指定相同的名称和扩展名,它将覆盖存储桶中的旧文件)。

关于您的库,Cloud Functions使用Python 3.7,该库暂时不支持example库,因此您需要找到另一个库。