这是我在100个时代训练的模型 类似型号和类似数据的准确度达到90% 我的问题是什么? 我认为随着时代的流逝,降低学习率是值得的。 您认为这对我有什么帮助?
答案 0 :(得分:2)
有一些微妙的差异。
您正在尝试将ImageNet样式架构应用于Cifar-10。第一个卷积是3 x 3
,而不是7 x 7
。没有最大池层。纯粹使用stride-2卷数对图像进行缩减采样。
您应该通过将featurewise_center = True
保留在ImageDataGenerator
中来实现以中心为中心。
请勿使用非常多的滤镜,例如[512,1024,2048]。你只有50,000张图像供你训练,不像ImageNet有大约一百万张。
简而言之,请阅读deep residual network paper中的第4.2节并尝试复制网络。您还可以阅读this博客。