应用错误收集

时间：2017-10-27 01:13:55

标签： deep-learning

我正在进行图像分类比赛。我有80个不同的班级，有近50000个培训数据。我已经对一些像Vgg或Resnet这样的预训练模型做了一些测试，两者都运行良好但不够好，训练acc几乎为1，验证为0.85（过度拟合）。我认为瓶颈在于数据，而不是模型，所以我想出了图像增强。

现在我很困惑，我应该将转换后的图像保存到磁盘，或者只为每个时期的每一批应用随机转换。我现在正在练习后者，事情并没有那么多改进。

答案 0 :(得分：1)

保存或不保存预处理数据最重要的是时间和一匙重复性，以防您在预处理过程中出现任何随机性。

如果不耗费时间，那么在飞行中进行操作应该是更简单的方法。另一方面，如果您的预处理很重（例如，当仅训练最后几层并因此使用中间层输出时），将此结果转储到磁盘应该更有用，这样您就不需要计算所有每次都是初始层。

换句话说，它不是一个技术问题而且倾销数据不应该干扰你的结果，而只是为了方便。