标签: data-augmentation
我正在训练UNET进行语义分割,但是我只有200张带标签的图像。鉴于数据集的规模很小,它肯定需要一些数据扩充技术。
我对测试和验证集有疑问。
我有自定义数据生成器,该数据生成器会从文件夹中继续提供训练模型的数据。
所以我打算做的是:
对训练集进行数据扩充并将其全部保存在同一文件夹中
“随机”选择一些训练数据到测试和验证集中(当然,在训练之前)。
我不确定是否可以,因为我们只是做一些简单的处理(翻转,转置,调整亮度)
最好先分离数据,然后对训练文件夹中的其余数据进行扩充吗?