以下是我使用TensorFlow 1.9的训练曲线:
是什么原因导致训练损失突然增加?
一些细节:
作为一个例子,网络对这两个例子的预测是:
[ 33.939026 -69.096344 75.832924 35.009373]
和
[ -87.652336 52.033615 -94.49006 -168.82799 ]
,这些示例的标签均为:
[ 2.041661e-02 -4.019599e-01 -1.813140e-04 1.500889e-01]
。因此,这分别导致3209和479的损失。
对于损失为“正常”的示例,典型的预测是:
[ 2.041661e-02 -4.019650e-01 -1.770628e-04 1.500889e-01]
标签为:
[-1.135244 -0.091564 0.46258 -0.078056]
。
因此,似乎突然之间,对一些训练示例所做的预测具有巨大的规模,然后这个强度很快就下降到了可以接受的水平。
关于是什么原因引起的,或者如何调试的任何想法?