如何准备从GCP提取AutoML实体的CSV文件?

时间:2019-05-20 11:31:38

标签: google-cloud-platform google-cloud-storage google-cloud-automl google-natural-language

我已经创建了Google指定的Jsonl文件和格式。我已将文件上传到Cloud Storage。

我准备了一个CSV文件,第一列具有Jsonl文件的路径(gs://*example/file.jsonl),第二列具有“ TRAIN”或“ VALIDATE”或“ TEST”。

我收到一条错误消息:“找不到引用的文件:请求中有TRAIN。”

如何准备CSV文件?

1 个答案:

答案 0 :(得分:2)

像您这样的Souds的列顺序是向后的。列的顺序应首先是“ ML Use”,然后是GCS URI。请参阅快速入门中的示例CSV文件:

https://cloud.google.com/natural-language/automl/entity-analysis/docs/quickstart

gs://cloud-ml-data/NL-entity/dataset.csv

https://console.cloud.google.com/storage/browser/cloud-ml-data/NL-entity/?_ga=2.132412110.-1530629862.1558449111

$ cat Downloads/NL-entity_dataset.csv 
TRAIN,gs://cloud-ml-data/NL-entity/train.jsonl
TEST,gs://cloud-ml-data/NL-entity/test.jsonl
VALIDATION,gs://cloud-ml-data/NL-entity/validation.jsonl