Google AutoML数据集所需的文件格式是什么?

时间:2019-02-08 17:09:53

标签: google-cloud-automl google-cloud-automl-nl

每当我尝试将数据集上传到AutoML自然语言Web UI时,都会出现错误

Something is wrong, please try again.

该文档对我的CSV文件的外观不是很有见地,但是我试图制作一个简单的示例文件只是为了确保它可以正常工作,它看起来像这样:

text,label
asdf,cat
asodlkao,dog
asdkasdsadksafask,cat
waewq23,cat
dads,cat
saiodjas,cat
skdoaskdoas,dog
hgfkgizk,dog
fzdrgbfd,cat
otiujrhzgf,cat
vchztzr,dog
aksodkasodks,dog
sderftz,dog
dsoakd,dog
qweqweqw,cat
asdqweqe,cat
dkawosdkaodk,dog
ewqeweq,cat
fdsffds,dog
bvcghh,cat
rthnghtd,dog
sdkosadkasodk,cat
sdjidghdfig,cat
kfodskdsof,dog
saodsadok,dog
ksaodksaod,dog
vncvb,cat

我根据Google建议的语法选择了这种格式 google syntax

但是即使使用这种格式,我仍然会遇到相同的错误 我已经看到了这个问题Format of the input dataset for Google AutoML Natural Language multi-label text classification,但是根据答案,看来我的格式应该可以工作,所以我不知道为什么会收到错误

2 个答案:

答案 0 :(得分:1)

我刚刚复制了CSV文件并将其上传到我自己的项目中,并且创建的数据集起作用了。一个问题是,额外的标签被创建为“标签”-这是因为标头不应该出现在csv文件中(可能应该得到修复)。

基于此,似乎问题不是CSV文件格式。我建议检查您的项目是否正确设置。您可以打开一个错误以获得他人的帮助。您可以在public issue tracker中打开错误,也可以使用UI发送反馈(页面右上角的菜单中有“反馈”选项)。

Dataset create

Created dataset

答案 1 :(得分:0)

我发现了问题!正如Michal K所说,格式化没有问题,真正的问题是我没有被分配存储对象创建者的角色,这是必要的,因为数据首先是在Cloud Storage中上传的。