我想跳过在本地创建avro文件并将其直接上传到Google Cloud Storage的步骤。
我检查了blob.upload from_string选项,但老实说,我不知道应将其替换为我的代码。而且我不知道这是否是我所需的最佳出路。这样,我可以通过将脚本包含在docker映像中来构建更现代的管道。
可以根据以下脚本以某种方式完成此操作:
Qty2
答案 0 :(得分:0)
我已经看过您的脚本,并且可以看到您正在从BigQuery获取数据。我可以确认您已重现您的方案,并且能够将数据从BigQuery直接导出到Google Cloud Storage,而无需在本地创建avro文件。
我建议您看看here,其中描述了如何将表格数据从BigQuery导出到Google Cloud Storage。以下是要执行的步骤:
尽管如此,也有可能使用Python做到这一点。我建议您看看here。
我希望这种方法对您有用。