如何使用torchvision.datasets.Imagefolder将数据分为训练集和测试集?

时间:2019-07-29 02:41:06

标签: machine-learning image-processing computer-vision pytorch

在我的自定义数据集中,一种图像位于torchvision.datasets.Imagefolder可以处理的一个文件夹中,但是如何将数据集拆分为训练和测试?

1 个答案:

答案 0 :(得分:0)

您可以使用torch.utils.data.Subset根据示例索引将ImageFolder数据集拆分为训练和测试。
例如:

orig_set = torchvision.datasets.Imagefolder(...)  # your dataset
n = len(orig_set)  # total number of examples
n_test = int(0.1 * n)  # take ~10% for test
test_set = torch.utils.data.Subset(orig_set, range(n_test))  # take first 10%
train_set = torch.utils.data.Subset(orig_set, range(n_test, n))  # take the rest