我主要理解k-fold交叉验证是如何工作的,并且已经开始在我的MATLAB脚本中实现它,但是我有两个问题。
当使用它来选择网络功能(隐藏单位,重量衰减之前和我的情况下没有迭代)。我应该在每次折叠之后重新确定权重,或者我应该将我的下一个训练折叠进入已经训练过的网络(它的权重是否已针对之前的折叠进行了优化)?
似乎做后者应该给出较低的误差,因为前一个数据折叠将是下一个的良好近似值,因此权重将比从高斯分布中随机初始化的权重更接近。
此外,使用k-fold验证和选择的网络超级参数等验证了网络,我想开始使用网络,我认为我应该停止使用k-fold验证并且只训练一次,使用所有可用的数据?
非常感谢您的帮助。
答案 0 :(得分:3)
是的,您应该在每次折叠后重新初始化权重,以便从“空白”网络开始。如果你不这样做,那么每个折叠都会“泄漏”到彼此之外,这不是K-Fold CV应该做的。
找到最佳超参数后,是的,您可以使用所有可用数据对其进行训练。请记住保留一些保留测试数据以进行最终测试。