小数据集,列车测试拆分或列车Val和测试?

时间:2019-11-12 09:57:53

标签: validation tensorflow keras regression train-test-split

我对论文做了一些预测(库存)。我只使用了固定数量的600个样本(无法更改)。由于数据集很小,我只进行了训练和测试拆分(无验证等)。我找到了一些设置,在训练和测试中我都能得到很好的结果(MAPE和R2)。但是我只有火车的损耗曲线。我想知道这是否足够,还是必须同时进行训练和验证损失曲线?

基于这种想法,我将其分为三种方式(10%保持测试),70%的训练和20%的验证。那里我都有两个损失曲线,我在火车Val和测试中的MAPE得分(所有三个方面都达到3-5%)获得了不错的成绩,在val设置(0,7和火车中)中只有R2不好/ test 0,95)

那么我可以使用第一种方法,而只使用火车损耗曲线吗?

1 个答案:

答案 0 :(得分:0)

如果您仅在单一数据模型上进行训练,我认为在这种情况下不需要验证集。据我了解,如果您正在使用多种模型进行培训,则验证集将更加有用,并且这将帮助您确定最合适的模型。

https://machinelearningmastery.com/difference-test-validation-datasets/