我已经使用和LSTM训练了一个网络,但是我发现有过度拟合而且已经尝试过LR /批量大小/优化器的几种组合,但是大多数组合给出了类似的图形。
我想知道我可以在75k迭代之前使用模型。 你会认为这个模型过于合适吗?
答案 0 :(得分:1)
实际上很难说这是否过度拟合 - 因为你在训练中的变异非常大。很可能,但不确定。
通常,您将创建一个验证数据集,在其中测试网络性能,然后选择产生最高分数的模型(包括一组超参数)。就这样。如果没有额外的验证设置,那将很难。
有很多技巧,包括:
答案 1 :(得分:0)
你所建议的技术称为early stopping,许多人已经将它用作对抗拟合的方法。您可以做的其他事情是减少网络规模或尝试收集更多数据。