在我看来,交叉验证用于通过使用尽可能多的数据来比较模型。例如,它可用于比较感知器神经网络和同一问题的决策树。或者它可以用于研究特定问题的神经网络的神经元数量。这是关于模型/架构的比较。
然而,在我看来,交叉验证似乎不适合找到神经网络的最佳权重,因为在每轮交叉验证中,权重都会重新初始化。
你能证实我的观点吗?交叉验证仅用于比较模型/体系结构,不适合找到这些模型/体系结构的最佳参数?
谢谢。
答案 0 :(得分:1)
你有正确的想法,是的。
通常,您使用交叉验证来估计未见数据的准确性。此估计值可帮助您选择合适的模型类型/参数等。
确定模型配置后,您可以在整个数据集上训练模型。 (请始终记住,整个数据集上的训练错误不是对未见数据错误的良好估计。)