交叉验证是用来找到最佳模型/架构还是模型/架构的最佳参数?

时间:2012-04-10 16:59:07

标签: machine-learning

在我看来,交叉验证用于通过使用尽可能多的数据来比较模型。例如,它可用于比较感知器神经网络和同一问题的决策树。或者它可以用于研究特定问题的神经网络的神经元数量。这是关于模型/架构的比较。

然而,在我看来,交叉验证似乎不适合找到神经网络的最佳权重,因为在每轮交叉验证中,权重都会重新初始化。

你能证实我的观点吗?交叉验证仅用于比较模型/体系结构,不适合找到这些模型/体系结构的最佳参数?

谢谢。

1 个答案:

答案 0 :(得分:1)

你有正确的想法,是的。

通常,您使用交叉验证来估计未见数据的准确性。此估计值可帮助您选择合适的模型类型/参数等。

确定模型配置后,您可以在整个数据集上训练模型。 (请始终记住,整个数据集上的训练错误不是对未见数据错误的良好估计。)