在pytorch网站上,他们的教程中包含以下模型
class BasicCNN(nn.Module):
def __init__(self):
super(BasicCNN, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = x.permute(0, 3, 1, 2)
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
此模型有多少个内核/过滤器?是两个吗-例如conv1和conv2。如何通过指定数量轻松地创建许多过滤器?例如100个过滤器。
谢谢!
答案 0 :(得分:1)
您的问题有点含糊,但让我尝试回答。
通常,在卷积层中,我们将过滤器的数量设置为out_channels
的数量。但这不是直截了当的。让我们根据您提供的示例进行讨论。
卷积层参数是什么?
model = BasicCNN()
for name, params in model.named_parameters():
if 'conv' in name:
print(name, params.size())
输出:
conv1.weight torch.Size([6, 3, 5, 5])
conv1.bias torch.Size([6])
conv2.weight torch.Size([16, 6, 5, 5])
conv2.bias torch.Size([16])
说明
让我们考虑以上模型中的conv1
层。可以说,有6个形状为5 x 5
的过滤器,因为我们选择了2d卷积。由于输入通道的数量为3,因此共有6 x 3 = 18
个内核。
在此,此模型的输入是3d图像。您可以考虑一下,我们有形状为W x H
的图像,并且图像有3个通道(RGB)。因此,我们可以将表示图像的3d张量馈送到该模型。
现在回到您的问题:“如何通过指定数量轻松地创建许多过滤器?例如100个过滤器。”。如果只想在每个输入通道中使用100个过滤器,则只需在conv1
中设置100个过滤器,而不是6
。这是人们通常在计算机视觉中所做的事情!
但是您绝对可以根据需要修改体系结构并确定最佳设置。