OneClass SVM模型使用预训练的ResNet50网络

时间:2018-06-16 15:40:39

标签: machine-learning keras

我正在尝试构建OneClass分类器以进行图像识别。我找到了this文章,但因为我没有完整的源代码,所以我并不完全明白我在做什么。

X_train, X_test, y_train, y_test = train_test_split(x, y, random_state=42)

# X_train (2250, 200, 200, 3)
resnet_model = ResNet50(input_shape=(200, 200, 3), weights='imagenet', include_top=False)
features_array = resnet_model.predict(X_train)
# features_array (2250, 7, 7, 2048)
pca = PCA(svd_solver='randomized', n_components=450, whiten=True, random_state=42)
svc = SVC(kernel='rbf', class_weight='balanced')
model = make_pipeline(pca, svc)

param_grid = {'svc__C': [1, 5, 10, 50], 'svc__gamma': [0.0001, 0.0005, 0.001, 0.005]}
grid = GridSearchCV(model, param_grid)
grid.fit(X_train, y_train)

我有2250张图片(食物而非食物)200x200px大小,我将此数据发送到ResNet50模型的预测方法。结果是(2250,7,7,2048)张量,任何人都知道这个维度是什么意思?

当我尝试运行grid.fit方法时出现错误:

ValueError: Found array with dim 4. Estimator expected <= 2.

1 个答案:

答案 0 :(得分:1)

这些是我可以做出的调查结果。

您将输出张量高于全局平均池层。 (请参阅resnet_model.summary()了解输入维度如何更改为输出维度)

要进行简单修复,请在resnet_model之上添加Average pooling 2d Layer。 (因此输出形状变为(2250,1,1,2048))

resnet_model = ResNet50(input_shape=(200, 200, 3), weights='imagenet', include_top=False)
resnet_op = AveragePooling2D((7, 7), name='avg_pool_app')(resnet_model.output)
resnet_model = Model(resnet_model.input, resnet_op, name="ResNet")

这通常出现在ResNet50本身的源代码中。基本上我们将一个AveragePooling2D层附加到resnet50模型。最后一行将图层(第2行)和基线模型组合成模型对象。

现在输出维度(feature_array)将为(2250, 1, 1, 2048)(因为添加了平均合并图层)。

要避免ValueError您应该将此feature_array重新整形为(2250, 2048)

feature_array = np.reshape(feature_array, (-1, 2048))

在问题的程序的最后一行,

grid.fit(X_train, y_train)

你适合X_train(在这种情况下是图像)。这里的正确变量是features_array(这被认为是图像的摘要)。输入此行将纠正错误,

grid.fit(features_array, y_train)

要通过提取特征向量以这种方式进行更多微调,请查看here(使用神经网络训练而不是使用PCA和SVM)。

希望这会有所帮助!!