我有几个相同神经网络的实现,但是每个都有不同的起始参数。
这是我比较基础实验的训练损失与另一个实验的训练损失的情节之一。
我还有其他实例:
有人可以给我一些指导,说明如何理解keras fit()的输出吗?请注意,我没有任何验证集。
谢谢
答案 0 :(得分:0)
这很奇怪,您的损失有堰峰,甚至价值增加。...
我可以想象一些原因:
您创建的函数不是连续的或具有怪异的行为,例如尖峰和其他可能使想法减少损失的东西。这包括平坦区域和陡峭区域之间的巨大反差。
您正在使用怪异的自定义优化器
您的学习率太大