采样并拆分数据集以进行多项图像分类,每个类别标签的图像存储在每个类别的单独文件夹中

时间:2018-12-05 03:06:59

标签: image random pytorch multiclass-classification train-test-split

如何从几个包含图像文件的文件夹中进行采样(不进行替换)(每个文件夹都属于其存储文件夹的类名称),以保持采样图像的相对比例。

例如,您有4类:狗,猫,鸟,乌龟。 有1000只狗,200只猫,200只鸟,1400只海龟。

  • 狗 | --img3487.png | --img2764.png ... | --img5773.png

  • 猫 | --img7701.png | --img5429.png ... | --img2716.png

  • 鸟 | --img5232.png | --img6705.png

  • 乌龟 | --img2601.png | --img7748.png

您要确保在将数据集拆分为70/10/20训练/验证/测试集时,从每只动物的文件夹中采样正确比例的图像。

0 个答案:

没有答案