我只是使用Pillow调整了图像数据集的大小,并通过以下步骤将其导出为JPEG: 数据集是10万名Celeb,但我很少提出测试建议。
img = img.crop([10, 10, 118, 118])
img = img.resize((image_size, image_size), Image.BILINEAR)
img.save(save_dir + img_list[i], 'JPEG')
然后我使用了Torchvision的Imagefolder函数从文件夹中读取数据
mydata = torchvision.datasets.ImageFolder(data_path_here, transform=transform)
图像已按预期以JPG格式导出,但是当尝试从torchvision
读取数据集时,它表明该文件不是JPEG格式。
RuntimeError: Found 0 files in subfolders of: Data/celeb_data/resized_celeb/
Supported extensions are: .jpg,.jpeg,.png,.ppm,.bmp,.pgm,.tif,.tiff,.webp
操作系统:Ubuntu 18.04 IDE:Pycharm 19
答案 0 :(得分:0)
像这样检查文件类型后会得到什么?
! apt install file
! file image.jpeg
答案 1 :(得分:0)
尝试重命名代码中的文件扩展名:
// img.save(save_dir + img_list[i], 'JPEG')
img.save(save_dir + img_list[i], 'jpeg')
答案 2 :(得分:0)
我认为您可能需要像这样重组目录:
Data/celeb_data/resized_celeb/label_name:
- 1.jpg
- 2.jpg
...
您可以在加载后丢弃标签。这为我解决了问题。希望对您有所帮助。