在训练/评估之前,Google的AutoML Table是否可以对我的数据样本进行随机排序?

时间:2019-07-10 19:04:30

标签: data-science google-cloud-automl

我一直在寻找文档,但仍然不知道该服务是否在培训/评估之前对数据进行了重新整理。我需要知道这一点,因为根据数据是时间序列,对于在较早的时间段内的样本上评估经过训练的模型将是现实的。

有人可以让我知道答案或指导我如何解决吗? 我知道我可以导出评估结果并对其进行调整,但是BigQuery似乎不尊重原始数据的顺序,并且数据中没有绝对的时间特征。

1 个答案:

答案 0 :(得分:0)

它不会洗牌但会分裂。

在这里看看:About controlling data split。它说:

  

默认情况下,AutoML表随机选择80%的数据行进行训练,10%进行验证和10%用于测试。

如果数据对时间敏感,则应使用Time column

通过使用它,AutoML表将使用最早的80%的行进行训练,接下来的10%的行进行验证以及最近的10%的行进行测试。