我有想要处理的图片。从这些图像中提取第一个特征,然后将这些特征输入神经网络进行训练。我虽然没有很多图像,但想生成更多数据。
1)产生过度拟合的原因是什么:我应该从原始图像生成更多图像,然后用它们提供整个管道,还是应该为提取的特征带来变化,然后用这种方式训练神经网络中的更多数据? / p>
第二种方法在计算上更便宜,但产生更好的结果?
2)对于生成更多数据(更多图像或更多图像),尝试了哪些技术?
答案 0 :(得分:0)
当您没有足够的数据时,您的模型的性能可能会很差。所以你必须尝试一些事情:
您还可以确定是否需要更多培训数据。在坐标轴中绘制训练数据和验证数据的分数。在 x 轴中,集合的大小(所有集合的10%,所有集合的20%,...,所有集合的90%)和 y 轴是得分。然后你看看图表。为了更好地理解我所说的我强烈推荐机器学习的Andrew Ng(https://www.coursera.org/learn/machine-learning)的视频,特别是第6周(应用机器学习的建议)