我一直在寻找文档,但仍然不知道该服务是否在培训/评估之前对数据进行了重新整理。我需要知道这一点,因为根据数据是时间序列,对于在较早的时间段内的样本上评估经过训练的模型将是现实的。
有人可以让我知道答案或指导我如何解决吗? 我知道我可以导出评估结果并对其进行调整,但是BigQuery似乎不尊重原始数据的顺序,并且数据中没有绝对的时间特征。
答案 0 :(得分:0)
它不会洗牌但会分裂。
在这里看看:About controlling data split。它说:
默认情况下,AutoML表随机选择80%的数据行进行训练,10%进行验证和10%用于测试。
如果数据对时间敏感,则应使用Time column。
通过使用它,AutoML表将使用最早的80%的行进行训练,接下来的10%的行进行验证以及最近的10%的行进行测试。