不能过拟合神经网络

时间:2021-04-12 13:19:03

标签: deep-learning computer-vision pytorch conv-neural-network

我有一个简单的编码器-解码器网络。编码器有几个 conv1d 层,最后是线性层,它们之间是 Relu,解码器由 conv1d 层和它们之间的 Relu 组成(没有批处理规范或 dropout)。 使用这个模型,我尝试过拟合一个示例,我使用批量大小=1 并始终提供相同的输入和相同的所需输出,但是没有成功。损失确实会下降到某个阈值,但无论我做什么,我都无法使损失低于此界限,并且输出无用。我尝试了更复杂的编码器/解码器,更改超参数,对我的数据进行不同的预处理,但我永远无法使损失低于该阈值。 仅就协议而言,如果我将其作为输入提供所需的输出(因此它将学习 id 函数),则网络可以工作,但这对我没有帮助。

如果我知道可能是什么问题,我将不胜感激。

1 个答案:

答案 0 :(得分:0)

以较低的学习率尝试更多的 epoch。
尝试增加 Dense 图层的大小。
尽量避免任何 Dropout 层。
如果这是您想要的,这些会使模型更容易过拟合。