Google Cloud Dataflow TextIO是否写入.gz文件?

时间:2017-06-23 08:36:01

标签: google-bigquery google-cloud-storage google-cloud-dataflow apache-beam

我们如何通过Google数据流作业在GCS中创建压缩文件?

我无法指定压缩类型。如果该功能尚未出现,是否有更简洁的方法从Google BigQuery的查询输出到压缩文件?

1 个答案:

答案 0 :(得分:6)

您需要使用TextIO写入文件(有关所有内置I / O转换的概述,请查看here)。

您可以在代码here中看到一个示例:

{{1}}

编辑:您还可以直接从GUI将表格从BigQuery导出到gzip压缩文件:enter image description here