应用错误收集

这是一个目前正在积极研究的一个很好的问题。

听起来好像你的原始实现已从其原始数据集中过度学习，使其无法有效地推广新数据。有许多技术可以防止这种情况发生：

确保您的网络是仍然可以解决问题的最小尺寸。
使用某种形式的正则化技术。我最喜欢的（也是当前研究人员最喜欢的）之一就是辍学技术。基本上每次你前进时，每个神经元都有百分之几的机会返回0而不是典型的激活。其他常见技术包括L1，L2和重量衰减。
玩你的学习常数。也许你的常数太高了。
最后按照你描述的方式继续训练。创建所有数据点（新旧）的缓冲区，并以随机顺序训练随机选择的点。这有助于确保您的网络不会降到当地最低限度。

我个人会在尝试限制神经元在每次迭代中学习的方法之前尝试这些技巧。如果使用Sigmoid或Tanh激活，则.5（sigmoid）或0（tanh）附近的值将具有较大的导数并且将快速变化，这是这些激活的优点之一。要达到类似但不那么突兀的效果：玩你的学习常数。我不确定你的网的大小，或你的样本数量，但尝试学习常数〜.01

如何防止NN忘记旧数据

1 个答案: