在使用训练测试拆分找到最佳的超参数后,是否应该对整个数据集重新训练模型?

时间:2020-01-22 01:31:53

标签: machine-learning data-science

我将数据集分为训练和测试。最后,在为训练数据集找到最佳的超参数之后,我是否应该使用所有数据再次拟合模型?关键是要使新数据的得分最高。

2 个答案:

答案 0 :(得分:0)

是的,这将有助于推广模型,因为更多的数据通常意味着更好的推广。

答案 1 :(得分:0)

我不这么认为。如果这样做,将不再具有有效的测试集。当您稍后回来改进模型时会发生什么?如果这样做,那么每个模型改进都将需要一个新的测试集,这意味着需要更多标签。您将无法在各个模型版本之间比较实验,因为测试集将不完全相同。

如果您认为该模型将永远完成,那么可以。