导出Google Cloud Datastore并以编程方式导入BigQuery

时间:2015-05-12 09:43:11

标签: google-bigquery google-cloud-datastore

我正在寻找一种方法来导出我的Cloud Datastore并每天将其导入BigQuery。手动方式在google page中描述。我没有找到一种自动化的简洁方法。

4 个答案:

答案 0 :(得分:4)

没有一种简单的方法可以做到这一点,但你可以将这两部分分开:创建appengine备份并将它们加载到bigquery中。

您可以使用计划备份定期创建数据存储备份(https://cloud.google.com/appengine/articles/scheduled_backups)。

然后,您可以使用Apps脚本自动执行BigQuery部分(https://developers.google.com/apps-script/advanced/bigquery#load_csv_data)或使用AppEngine cron执行相同的操作。

答案 1 :(得分:2)

截至上周,有一种自动化的正确方法。最重要的部分是gcloud beta datastore export

我围绕它创建了一个脚本:https://github.com/chees/datastore2bigquery 你可以在一个cron工作中运行它。

请点击此处查看其工作原理的演示:https://www.youtube.com/watch?v=dGyQCE3bWkU

答案 2 :(得分:1)

基于@ Jordan上面的答案,执行此操作的步骤将是:

1)制作存储桶

2)将数据存储区实体导出到此存储区

3)打开Big Query Web UI,并使用Google Cloud文件路径加载。

this post可提供包含图片的完整教程。

答案 3 :(得分:-2)

可以使用以下代码。它基本上使用App Engine Cron作业和BigQuery API。

https://github.com/wenzhe/appengine_datastore_bigquery