标签: machine-learning neural-network deep-learning caffe
我在一个数据集中训练了我的网络。我得到了训练损失/迭代如下:
如你所见,损失在某些点迅速增长,如红色箭头所示。我使用亚当求解器,学习率为0.001,动量为0.9,重量衰减为0.0005,没有辍学。在我的网络中,我使用了BatchNorm,Pooling,Conv。从上图中可以看出。你能建议我的问题是什么以及如何解决?谢谢大家
更新:这是更详细的数字