我需要将GCS存储桶中的多个JSON文件导出到BigQuery。
它们不是用换行符分隔的,所以我需要编辑文件,并且我正在寻求使用Cloud Shell大规模执行此操作,因为这样的数据转储会经常发生。
我当时认为应该是
gsutil cat gs://triad_data/file_testing/Appointment.json | jq -c '.[]' > apptNDJSON.json
但是我不知道如何为我的存储桶中的所有项目输送管道。这是正确的思路还是在GCP中无法进行这样的操作?
答案 0 :(得分:0)
Cloud Storage不是文件系统。您只能写入,删除和读取。没有更新,没有动静。您可以激活版本控制以创建新版本,但不能直接在GCS上更新现有的Blob。
在GCS上,尤其是在gsutil上,执行命令"gsutil cat"将对象内容连接到stdout,换句话说,在控制台上显示文件的内容。
与您要查找的命令更相似的命令是"gsutil compose",但这会将File_A和File_B的内容合并到一个新的File_C中,这不是您要查找的。 p>
您需要对应用进行编码,以下载文件,编辑内容,然后再次上传文件或类似内容