标签: deep-learning pytorch resnet densenet hinge-loss
我正在尝试在CIFAR 100数据集上使用带有密集网的铰链损耗。学习收敛到某个点,此后就没有学习了。准确性远低于具有CrossEntropy损失功能的Densenet。我尝试了不同的学习速度和体重下降。
关于为什么我无法通过铰链损失正确训练Densenet的任何想法?我可以在Resnet上使用铰链损耗,而没有任何问题。