标签: python neural-network keras deep-learning
我在喀拉拉邦训练了一个简单的神经网络。在某些时期之后,训练损失和验证损失显示出规则的峰值。该图的x轴为历元,y轴为损耗。注意,较大的验证损失峰值与较小的训练损失峰值相对应。我使用了fit_generator。我尝试了优化程序SGD和Adam,但峰值仍然出现。 有趣的是,更改批次大小不会影响峰值的形状或周期。更改优化程序会影响尖峰幅度,但不会影响重复周期。 对为什么会这样有任何想法吗?