我正在尝试构建可以根据用户情绪对图像进行分类的cnn模型(keras)。我遇到了数据问题。我的训练数据非常少。扩充数据会有帮助吗?它会提高准确性吗?在这种情况下,应该选择增加数据并避免使用?
答案 0 :(得分:2)
是的,数据增加确实有帮助,有时它确实是必要的。 (但是看看Martin Thoma的答案,那里有更多细节和一些重要的"照顾")。
你应该在以下时间使用它:
当模型能够记忆数据时,会发生过度拟合。然后它获得了训练数据的精确准确性,但测试数据的准确性很差。
增加训练数据的大小会使您的模型难以记忆。这里和那里的细微变化将使您的模型停止关注不具有任何意义的细节(但能够创建图像之间的区别)并开始关注确实产生预期效果的细节。
答案 1 :(得分:2)
扩充数据会有帮助吗?它是否提高了准确性?
事先很难说。但几乎可以肯定,当你已经拥有一个比随机更好的模型时。当你选择正确的增强方法时。
有关许多不同的增强方法,请参阅我的硕士论文Analysis and Optimization of Convolutional Neural Network Architectures,第80页。
在哪种情况下,应该选择增加数据并避免使用?
6 vs 9
或u vs n
或\rightarrow vs \nearrow
)