应用错误收集

Google Cloud中的音频编码，采样率和重新编码

时间：2018-12-18 15:30:18

标签： encoding gcloud google-speech-api sox

是否可以在无需下载的情况下查找存储在Google Cloud中的文件的音频元数据？构建Google Speech-to-Text API服务时，您将其传递给gs://bucket/file.flac，并且我知道sox和ffmpeg bash和Python命令可用于本地存储的文件元数据查找，但是我可以似乎没有找到在Google Cloud Storage文件中查找音频文件元数据的方法。

如果我有gs://bucket/audio.wav，是否可以使用sox / py-sox重新编码并将新的audio.flac直接写入gs://bucket/audio.flac？还是我必须下载audio.wav才能对其重新编码？

任何想法或指示都会受到赞赏。

1 个答案:

答案 0 :(得分：0)

否，无法直接在Google Cloud Storage中访问所需的元数据。使用命令gsutil ls -L gs://[bucket_name]/[file_name]将在存储桶中提示该文件的元数据。您可以modify these metadata，但不能指的是py-sox。您需要下载文件，对其重新编码，然后再次上传。

您无法在Cloud Storage中进行重新编码操作，您需要先下载文件并按所需方式对其进行处理，然后再将其重新上传到存储桶中。但是，如果可以的话，这是一种解决方法：

创建上传文件时触发的Cloud Function。然后，检索刚刚上传的文件并对其执行所需的任何操作（例如重新编码为.flac）。之后，再次上传（小心！如果为新文件指定相同的名称和扩展名，它将覆盖存储桶中的旧文件）。

关于您的库，Cloud Functions使用Python 3.7，该库暂时不支持example库，因此您需要找到另一个库。