为什么平均网络模型可以提高测试集的性能?

时间:2018-07-12 04:03:34

标签: machine-learning neural-network deep-learning

随着人们训练一些网络模型,然后进行模型平均以提高最终网络的性能。然后,我想知道为什么平均模型可以工作?有任何论文或解释吗?

实际上Dropout也是模型平均值,那么为什么dropout可以起作用?

1 个答案:

答案 0 :(得分:1)

人们采用模型平均值,这样,如果任何模型对数据的拟合度过高,组合起来的模型平均值将能够提供更为通用的预测。