首先是数据扩充还是数据集拆分?

时间:2019-04-18 18:19:59

标签: keras

我想创建一个CNN二进制分类器来识别卫星图像。我大约有13000张照片。我拍摄了8000张照片,分为两组:一组出现对象,另一组。从8000张照片中,只有85张照片具有我正在搜索的元素。我现在是否应该旋转,缩放等这85张照片,使其达到400张,然后将这两组划分为训练,有效和测试数据集?

1 个答案:

答案 0 :(得分:0)

85张图像对于训练模型似乎很少。但是我绝对会先将它们分为训练,验证和测试,因为您要确保这些集合尽可能地不同。如果先应用数据增强然后分成几组,则需要注意一个图像的所有变体最终都集中在同一组中。先拆分然后扩充数据似乎是更安全的方法。