验证集是训练集的一部分吗?

时间:2019-11-29 15:45:11

标签: validation machine-learning model

在机器学习中,我们使用验证集来调整超参数。但是我对验证集的起源感到困惑。它是训练集的一部分吗?这意味着该模型之前已经查看过数据。还是像测试集一样,即模型从未见过的数据?我真的很困惑。

1 个答案:

答案 0 :(得分:2)

您应该将训练数据分为两部分,一个用于训练,另一个用于验证。

您在第一部分训练数据,同时根据验证分数设置超参数。通常使用80%-20%的分割率,其他值可能会更好,具体取决于您拥有的数据量。

对于算法的最终评估,请使用另一个单独的测试集,该集既未包含在训练中也未包含在超参数搜索中。