测试集可以用作验证集

时间:2017-11-12 12:37:31

标签: python machine-learning

可以将testing_set用作validation_set吗?

validation_set是否对模型学习有任何影响,或仅用于检查每个时期的验证准确度?

我正在使用keras库作为建筑模型。

    model.fit(X_train, Y_train,
                      batch_size=batch_size,
                      epochs=epochs,
                      verbose=2,
                      validation_data=(X_test, Y_test))

2 个答案:

答案 0 :(得分:1)

您可以使用验证集来确定您过度配合的程度,并决定何时停止学习。因此,要获得或多或少的“独立”质量度量模型,您需要另一组数据,即测试集。

有关详细信息,请参阅以下discussion

如果你正在使用Keras,你可以将validation_split参数传递给模型,以便Keras为你分割列车集数据。

答案 1 :(得分:0)

如果测试集是 true 测试集,则永远不应将标签提供给模型。如果您也将测试集用作验证集,那么虽然您的模型不一定需要在验证集上进行培训,但在培训期间它将看到此集合的标签

因此,简而言之,您确实需要三个不同的数据集来进行培训,验证和测试。

如果您需要其他资源,here是将这些内容分解为不同目的的视频,here是另一个用于在Keras中使用验证集的视频。