我有一张大桌子(大约1000万行),我试图进入我的大问题。由于创建表时的大小限制,我不得不将CSV上传到存储桶中。当我尝试使用数据存储创建表时,作业失败并显示错误:
Error Reason:invalid. Get more information about this error at Troubleshooting Errors: invalid.
Errors:
gs://es_main/provider.csv does not contain valid backup metadata.
Job ID: liquid-cumulus:job_KXxmLZI0Ulch5WmkIthqZ4boGgM
Start Time: Dec 16, 2015, 3:00:51 PM
End Time: Dec 16, 2015, 3:00:51 PM
Destination Table: liquid-cumulus:ES_Main.providercloudtest
Source URI: gs://es_main/provider.csv
Source Format: Datastore Backup
我使用同一个表中的一小行样本文件,只是在表格创建中使用CSV功能上传而没有任何错误,并且可以很好地查看数据,这让我很麻烦。
我只是想知道应该使用"编辑元数据来设置元数据"桶内的选项或者如果我还缺少其他工作。感谢
答案 0 :(得分:2)
您发布的作业的错误消息告诉您,您提供的文件不是Datastore Backup file。请注意"数据存储"这意味着Google Cloud Datastore,这是另一种存储解决方案,它听起来像你没有使用。 Cloud Datastore Backup是该存储产品中的特定文件类型,与CSV或JSON不同。
在Google云端存储浏览器中设置文件元数据,这是"编辑元数据"您正在谈论生活的选项应该对BigQuery如何导入文件没有影响。如果您从云存储中更多地处理文件,这可能很重要,但就我所知,它对BigQuery并不重要。
要将CSV文件从Google云端存储上传到BigQuery,请务必选择CSV源格式和Google存储加载源,如下图所示。