应用错误收集

我刚刚提出了一种深度学习模型训练方法，并且有效！

（使用Cifar-100模型，某些模型的分类精度提高了0.5％至3％以上）

但是事情是...我真的很想写一些论文，但是我不知道为什么权重参数的泛化能力得到了改善。

我只是绘制了损失景观（https://github.com/tomgoldstein/loss-landscape），但是W / O提出的方法和W / O并没有明显的区别。

所以我的问题是，是否有任何有关VGGs或ResNet之类的深度神经网络泛化能力的论文？

我真的想找出网络更广泛地推广的原因。

请让我认识大家：）