为何使用交叉验证?

时间:2014-01-30 00:41:16

标签: machine-learning artificial-intelligence cross-validation kaggle

我正在参加几个Kaggle机器学习比赛,我只是有一个简单的问题。为什么我们使用交叉验证来评估我们在这些比赛中的算法效果?

当然,在这些比赛中,您在公共排行榜中的分数,您的算法将根据实际实时数据进行测试,可以更准确地表示您的算法效果吗?

1 个答案:

答案 0 :(得分:2)

交叉验证是模型构建中的必要步骤。如果交叉验证会给您带来糟糕的结果,那么即使在实时数据上进行尝试也没有任何意义。您正在训练和验证的集合也是实时数据,不是吗?所以,结果应该是相似的。如果不验证您的模型,您无法对其性能有任何了解。在训练集上提供100%准确度的模型可以在验证集上给出随机结果。

让我重新进行迭代,交叉验证不是实时数据测试的替代品,它是模型构建过程的一部分。