从存储桶文件

时间:2015-12-16 21:35:18

标签: google-bigquery google-cloud-storage

我有一张大桌子(大约1000万行),我试图进入我的大问题。由于创建表时的大小限制,我不得不将CSV上传到存储桶中。当我尝试使用数据存储创建表时,作业失败并显示错误:

Error Reason:invalid. Get more information about this error at Troubleshooting Errors: invalid.
Errors:
gs://es_main/provider.csv does not contain valid backup metadata.
Job ID: liquid-cumulus:job_KXxmLZI0Ulch5WmkIthqZ4boGgM
Start Time: Dec 16, 2015, 3:00:51 PM
End Time: Dec 16, 2015, 3:00:51 PM
Destination Table: liquid-cumulus:ES_Main.providercloudtest
Source URI: gs://es_main/provider.csv
Source Format: Datastore Backup

我使用同一个表中的一小行样本文件,只是在表格创建中使用CSV功能上传而没有任何错误,并且可以很好地查看数据,这让我很麻烦。

我只是想知道应该使用"编辑元数据来设置元数据"桶内的选项或者如果我还缺少其他工作。感谢

1 个答案:

答案 0 :(得分:2)

您发布的作业的错误消息告诉您,您提供的文件不是Datastore Backup file。请注意"数据存储"这意味着Google Cloud Datastore,这是另一种存储解决方案,它听起来像你没有使用。 Cloud Datastore Backup是该存储产品中的特定文件类型,与CSV或JSON不同。

在Google云端存储浏览器中设置文件元数据,这是"编辑元数据"您正在谈论生活的选项应该对BigQuery如何导入文件没有影响。如果您从云存储中更多地处理文件,这可能很重要,但就我所知,它对BigQuery并不重要。

要将CSV文件从Google云端存储上传到BigQuery,请务必选择CSV源格式和Google存储加载源,如下图所示。

Select data step showing how to select CSV format and GCS URI