我刚刚提出了一种深度学习模型训练方法,并且有效!
(使用Cifar-100模型,某些模型的分类精度提高了0.5%至3%以上)
但是事情是...我真的很想写一些论文,但是我不知道为什么权重参数的泛化能力得到了改善。
我只是绘制了损失景观(https://github.com/tomgoldstein/loss-landscape),但是W / O提出的方法和W / O并没有明显的区别。
所以我的问题是,是否有任何有关VGGs或ResNet之类的深度神经网络泛化能力的论文?
我真的想找出网络更广泛地推广的原因。
请让我认识大家:)