machine-learning - 交叉验证是用来找到最佳模型/架构还是模型/架构的最佳参数？

时间：2012-04-10 16:59:07

标签： machine-learning

在我看来，交叉验证用于通过使用尽可能多的数据来比较模型。例如，它可用于比较感知器神经网络和同一问题的决策树。或者它可以用于研究特定问题的神经网络的神经元数量。这是关于模型/架构的比较。

然而，在我看来，交叉验证似乎不适合找到神经网络的最佳权重，因为在每轮交叉验证中，权重都会重新初始化。

你能证实我的观点吗？交叉验证仅用于比较模型/体系结构，不适合找到这些模型/体系结构的最佳参数？

谢谢。

答案 0 :(得分：1)

你有正确的想法，是的。

通常，您使用交叉验证来估计未见数据的准确性。此估计值可帮助您选择合适的模型类型/参数等。

确定模型配置后，您可以在整个数据集上训练模型。（请始终记住，整个数据集上的训练错误不是对未见数据错误的良好估计。）