为什么三元组损失选择硬负数会导致模型崩溃?那是梯度爆炸问题吗?

时间:2019-05-05 02:07:07

标签: optimization deep-learning face-recognition

在论文中:

enter image description here

作者声称选择硬底片通常会导致模型崩溃,但是根据梯度,硬底片的梯度甚至小于半硬片

0 个答案:

没有答案