深度学习的数据增强

时间:2017-05-21 06:34:30

标签: neural-network computer-vision deep-learning conv-neural-network

我正在使用CNN进行草杂草检测。我现在有2节课,每节课,我有18张照片。我可以应用数据增强方法来增加数据集以使用CNN吗?以及多少数据就足够了?

另外,我可以将哪些方法与CNN进行比较,以显示CNN比其他方法更好的性能?

2 个答案:

答案 0 :(得分:0)

如果你想直接进行深度学习,通常你计划按班级(http://www.deeplearningbook.org/)拍摄5.000张图像。您可以通过使用微调(中等数量的样本~1000)或转移学习(低数量样本~100)来减少此数字。这些是使用增强之前的数字。

当然,您可以使用扩充来增加数据集的有效大小,但这与至少拥有100个图像不同。深度学习是非常数据密集型的,因此不适合18个图像。

其他方法大多是手工制作的。你可以做一些像猪的功能,并使用任何其他ML技术作为分类,如SVM / Boosting / Bagging /等。

答案 1 :(得分:0)

  • 只有18张图片CNN会很好用但不会取得优异成绩
  • 有18张图片,CNN有机会过度训练训练数据,因此您使用的CNN模型可能会很棘手
  • 我建议使用HOG + SVM来解决这个问题,它们会很好地运行
  • 但是如果您确实使用数据扩充,那么您的CNN将会表现出色
  • 您可以使用keras.preprocessing.image.ImageDataGenerator为您生成数据。您只需指定要生成的图像数量
  • 您还可以翻转18张图像并旋转图像并翻译图像以自行添加数据
  • 要获得更复杂的图片增强功能,您可以参考 link