我目前正在训练一个神经网络,对食物图像的食物组进行分类,从而得到5种输出类别。但是,每当我开始训练网络时,都会出现此错误:
ValueError: Expected input batch_size (64) to match target batch_size (30).
这是我的神经网络定义和培训代码。我真的会寻求帮助,我是pytorch的新手,无法确切了解代码中的问题。谢谢!
#Define the Network Architechture
model = nn.Sequential(nn.Linear(7500, 4950),
nn.ReLU(),
nn.Linear(4950, 1000),
nn.ReLU(),
nn.Linear(1000, 250),
nn.ReLU(),
nn.Linear(250, 5),
nn.LogSoftmax(dim = 1))
#Define loss
criterion = nn.NLLLoss()
#Initial forward pass
images, labels = next(iter(trainloader))
images = images.view(images.shape[0], -1)
print(images.shape)
logits = model(images)
print(logits.size)
loss = criterion(logits, labels)
print(loss)
#Define Optimizer
optimizer = optim.SGD(model.parameters(), lr = 0.01)
培训网络:
epochs = 10
for e in range(epochs):
running_loss = 0
for image, labels in trainloader:
#Flatten Images
images = images.view(images.shape[0], -1)
#Set gradients to 0
optimizer.zero_grad()
#Output
output = model(images)
loss = criterion(output, labels) #Where the error occurs
loss.backward()
#Gradient Descent Step
optimizer.step()
running_loss += loss.item()
else:
print(f"Training loss: {running_loss/len(trainloader)}")
答案 0 :(得分:0)
不确定100%,但我认为错误在于此行:
nn.Linear(7500, 4950)
输入1而不是7500,除非您完全确定输入为7500。请记住,第一个值将始终是输入大小。放置1,可以确保您的模型可以处理任何尺寸的图像。
顺便说一句,PyTorch具有展平功能。使用nn.Flatten
而不是images.view()
,因为您不想犯任何形状错误,也不必浪费更多时间。
您犯的另一个小错误是继续在{循环中使用images and image
作为变量和参数。这确实是一种不好的做法,因为每当别人阅读您的代码时,您都会使他们感到困惑。确保不要重复使用相同的变量。
还可以提供有关数据的更多信息吗?像是灰度,image_size等。
答案 1 :(得分:0)
错误结果出在“对于图像,trainloader中的标签:”行(应该是图像)。修复它,现在模型的训练很好。