在AutoML批量预测结果上指定BigQuery数据集/表的名称

时间:2019-12-05 19:44:47

标签: google-bigquery google-cloud-automl

基本上我想在AutoML的批量预测结果上指定BigQuery数据集/表的名称。

但是查看以下文档,数据集和表的名称会自动生成。并且将为每次执行的批次预测创建一个新的数据集。

  

https://cloud.google.com/automl-tables/docs/predict-batch#bq-results

请参阅以下文档,在BigQuery目标上只能指定projectId:

  

https://cloud.google.com/automl/docs/reference/rest/v1beta1/BigQueryDestination

我计划每周自动进行批量预测。为了使预测结果更“干净”,我想将所有预测结果分组到一个数据集中,而不是为每个批次预测都使用单独的数据集。

是否可以通过提供的API来完成它?

1 个答案:

答案 0 :(得分:0)

如果未记录,则无法通过API进行操作,那么,如果要在同一数据集中创建所有输出,则可以将结果发送到存储区目录[1],这样它将创建您的Google云端存储桶中有多个CSV文件[2]。

因此,现在您必须创建一种方法,以便在每次进行批预测时从此存储桶读取新文件,并在所需数据集中创建新表。 这是一个文档,向您展示如何从Google Cloud Storage [3]中的CSV文件创建新表。

另一种方法是从新创建的表转移到所需的数据集[4],但是每次创建新表时都必须这样做。

[1] https://cloud.google.com/automl-tables/docs/predict-batch#using_csv_files_in

[2] https://cloud.google.com/automl-tables/docs/predict-batch#csv-results

[3] https://cloud.google.com/bigquery/external-data-cloud-storage#creating_and_querying_a_permanent_external_table

[4] https://cloud.google.com/bigquery/docs/managing-tables#copying_a_single_source_table