Question

我想通过将图像通过预先训练的VGG-16来获得图像的特征向量。我使用了经过预训练的Resnet50来获取特征向量，并且效果很好。但是，当我使用相同的方法从VGG-16网络获取特征向量时，却没有获得我认为应该获得的4096维向量。我从各种来源获得了代码，如下所示：

vgg16_model=models.vgg16(pretrained=True)
modules=list(vgg16_model.children())[:-1]
vgg16_model=nn.Sequential(*modules)

data=moveaxis(data,2,0)
img_var=Variable(torch.from_numpy(data).unsqueeze(0)).float()
features_var=vgg16_model(img_var)
features=features_var.data
features=features.data.numpy()
print(features.shape)

变量“data”是尺寸为(300, 400, 3)的图像numpy数组因此，我使用移动轴使轴混杂，因此我有3个通道而不是300个。我得到的输出（features.shape）是：(1, 512, 7, 7) 我想要像softg层之前的VGG-16给出的4096-d向量。我什至尝试了list(vgg16_model.classifier.children())[:-1]的方法，但是效果也不太好。关于此的讨论很多，但没有一个对我有用。让我知道我可能要去哪里了。谢谢！

使用预先训练的VGG-16从图像中获取特征向量

0 个答案: