我试图在我的文本图像数据集中训练SRGAN模型。那是100 160x30 .png文件。
这是模型: https://github.com/leftthomas/SRGAN/blob/master/model.py https://github.com/leftthomas/SRGAN/blob/master/train.py (除了更改数据集的路径外,我没有做任何其他更改)
我将crop_size设置为24,将upscale设置为2,然后开始训练,但是随后出现以下错误:
logs/1970/01/01/0030_0.gz
我确定我的所有图像都有3个通道,这已由RuntimeError: Given groups=1, weight of size [64, 3, 9, 9], expected input[64, 4, 12, 12] to have 3 channels, but got 4 channels instead
确认。
尽管如此,但我仍然受困,老实说,我不知道第四个频道到底在哪里。
非常感谢您的帮助。