deep-learning - 不能过拟合神经网络

我有一个简单的编码器-解码器网络。编码器有几个 conv1d 层，最后是线性层，它们之间是 Relu，解码器由 conv1d 层和它们之间的 Relu 组成（没有批处理规范或 dropout）。使用这个模型，我尝试过拟合一个示例，我使用批量大小=1 并始终提供相同的输入和相同的所需输出，但是没有成功。损失确实会下降到某个阈值，但无论我做什么，我都无法使损失低于此界限，并且输出无用。我尝试了更复杂的编码器/解码器，更改超参数，对我的数据进行不同的预处理，但我永远无法使损失低于该阈值。仅就协议而言，如果我将其作为输入提供所需的输出（因此它将学习 id 函数），则网络可以工作，但这对我没有帮助。

如果我知道可能是什么问题，我将不胜感激。

不能过拟合神经网络

1 个答案: