应用错误收集

时间：2019-07-10 19:04:30

标签： data-science google-cloud-automl

我一直在寻找文档，但仍然不知道该服务是否在培训/评估之前对数据进行了重新整理。我需要知道这一点，因为根据数据是时间序列，对于在较早的时间段内的样本上评估经过训练的模型将是现实的。

有人可以让我知道答案或指导我如何解决吗？我知道我可以导出评估结果并对其进行调整，但是BigQuery似乎不尊重原始数据的顺序，并且数据中没有绝对的时间特征。

答案 0 :(得分：0)

它不会洗牌但会分裂。

在这里看看：About controlling data split。它说：

默认情况下，AutoML表随机选择80％的数据行进行训练，10％进行验证和10％用于测试。

如果数据对时间敏感，则应使用Time column。

通过使用它，AutoML表将使用最早的80％的行进行训练，接下来的10％的行进行验证以及最近的10％的行进行测试。