CNN Keras狗的猫分类,如果图片中同时包含狗和猫

时间:2018-07-15 05:31:28

标签: python machine-learning keras convolution multilabel-classification

我修改了狗猫的二进制分类,通过使用输出层中的Sigmoid激活函数对每个类别进行预测,以进行多类激活,但是未能获得预期的结果。

我创建了一张在一张图片中同时包含猫和狗的图片。

预期结果: 狗:70%或70%以上,猫:70%或70%以上

实际结果: 狗:70%,猫:25%

为什么不能高精度地预测单个班级?

import numpy as np
from keras.models import Sequential;
from keras.layers import Conv2D, MaxPooling2D, Dense, Flatten;
from keras.utils.np_utils import to_categorical
from keras import optimizers

classifier = Sequential();

classifier.add(Conv2D(32,(3,3),input_shape=(64,64,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));

classifier.add(Conv2D(32,(3,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));

classifier.add(Conv2D(32,(3,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));

classifier.add(Flatten());

classifier.add(Dense(100, activation='sigmoid'))
classifier.add(Dense(2,activation='sigmoid'));

classifier.compile(optimizer="adam", loss='categorical_crossentropy', metrics=['accuracy'])

from keras.preprocessing.image import ImageDataGenerator

trainingDataOptions = ImageDataGenerator(rescale=1./255,shear_range=0.2,zoom_range=0.2,horizontal_flip=True)
testingDataOptions = ImageDataGenerator(rescale=1./255)

trainingData = trainingDataOptions.flow_from_directory('dataset/training',target_size=(64,64),batch_size=32);
testingData = testingDataOptions.flow_from_directory('dataset/testing',target_size=(64,64),batch_size=32);

classifier.fit_generator(trainingData, samples_per_epoch=1757, nb_epoch=10, validation_data=testingData, nb_val_samples=308)

classifier.save('model.h5')

# Output
from keras.preprocessing import image
test_image = image.load_img('samples/319b5fa.jpg',target_size=(64,64))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis=0)

res = classifier.predict(test_image)
label_map = (trainingData.class_indices)

print(res);

i = 0;
for label in label_map:
    score = res[0][i]
    score = score*100
    score = "{0:.0f}".format(score)
    print(label,"====>",score,'%');
    i = i+1;

我没有在输出层中使用softmax,那么为什么单个预测的总和不超过100%?它将多类分类始终保持在1.0以下(我想这与分布概率的softmax有关)。

1 个答案:

答案 0 :(得分:0)

准确地说,您想进行多标签多类分类或只是简单地进行多标签分类(即,每张图像可能属于零个,一个或多个类,例如,一张图像可能同时包含猫和狗提到)。因此,对于Dense层,选择S形激活是正确的,因为每个类别都独立于另一个类别,并且应该获得0到1之间的值(即对应于概率)。

但是,您还必须将损失从[2,-1,2,1,2,1,2,1,0,1,0,-1,0]更改为'categorical_crossentropy',因为在这里您不再进行单标签多类分类(即,该图像中存在哪只狗或猫? )。而您正在执行一堆二进制分类(即cat是否存在?dog是否存在?)。对于这种情况,适当的损失将是'binary_crossentropy'