在GCP存储桶中编辑多个文件

时间:2020-05-19 14:24:45

标签: google-cloud-platform google-cloud-storage gsutil

我需要将GCS存储桶中的多个JSON文件导出到BigQuery。

它们不是用换行符分隔的,所以我需要编辑文件,并且我正在寻求使用Cloud Shell大规模执行此操作,因为这样的数据转储会经常发生。

我当时认为应该是

gsutil cat gs://triad_data/file_testing/Appointment.json | jq -c '.[]' > apptNDJSON.json

但是我不知道如何为我的存储桶中的所有项目输送管道。这是正确的思路还是在GCP中无法进行这样的操作?

1 个答案:

答案 0 :(得分:0)

Cloud Storage不是文件系统。您只能写入,删除和读取。没有更新,没有动静。您可以激活版本控制以创建新版本,但不能直接在GCS上更新现有的Blob。

在GCS上,尤其是在gsutil上,执行命令"gsutil cat"将对象内容连接到stdout,换句话说,在控制台上显示文件的内容。

与您要查找的命令更相似的命令是"gsutil compose",但这会将File_A和File_B的内容合并到一个新的File_C中,这不是您要查找的。

您需要对应用进行编码,以下载文件,编辑内容,然后再次上传文件或类似内容