标签: machine-learning neural-network deep-learning
随着人们训练一些网络模型,然后进行模型平均以提高最终网络的性能。然后,我想知道为什么平均模型可以工作?有任何论文或解释吗?
实际上Dropout也是模型平均值,那么为什么dropout可以起作用?
答案 0 :(得分:1)
人们采用模型平均值,这样,如果任何模型对数据的拟合度过高,组合起来的模型平均值将能够提供更为通用的预测。