最近我发现了一个神经网络试图对字符进行分类的例子。有训练有两个神经网络。一个有嘈杂的数据集,第二个没有它。我试图找到任何理论上的解释为什么使用嘈杂的训练集可以得到更好的结果,但我还没有理解。有人能解释一下吗?提前致谢
答案 0 :(得分:0)
使用噪声训练NN可以改善泛化(网络为新的未知数据提供正确预测的能力),因为噪声使NN更难以精确地拟合每个数据点(防止NN仅记住训练数据的精确值,因此强迫它学习更有意义的关系)。有关噪声与其他形式正则化之间关系的数学详细信息和信息,您可以查看this paper