我修改了狗猫的二进制分类,通过使用输出层中的Sigmoid激活函数对每个类别进行预测,以进行多类激活,但是未能获得预期的结果。
我创建了一张在一张图片中同时包含猫和狗的图片。
预期结果: 狗:70%或70%以上,猫:70%或70%以上
实际结果: 狗:70%,猫:25%
为什么不能高精度地预测单个班级?
import numpy as np
from keras.models import Sequential;
from keras.layers import Conv2D, MaxPooling2D, Dense, Flatten;
from keras.utils.np_utils import to_categorical
from keras import optimizers
classifier = Sequential();
classifier.add(Conv2D(32,(3,3),input_shape=(64,64,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));
classifier.add(Conv2D(32,(3,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));
classifier.add(Conv2D(32,(3,3),activation='relu'));
classifier.add(MaxPooling2D((2,2)));
classifier.add(Flatten());
classifier.add(Dense(100, activation='sigmoid'))
classifier.add(Dense(2,activation='sigmoid'));
classifier.compile(optimizer="adam", loss='categorical_crossentropy', metrics=['accuracy'])
from keras.preprocessing.image import ImageDataGenerator
trainingDataOptions = ImageDataGenerator(rescale=1./255,shear_range=0.2,zoom_range=0.2,horizontal_flip=True)
testingDataOptions = ImageDataGenerator(rescale=1./255)
trainingData = trainingDataOptions.flow_from_directory('dataset/training',target_size=(64,64),batch_size=32);
testingData = testingDataOptions.flow_from_directory('dataset/testing',target_size=(64,64),batch_size=32);
classifier.fit_generator(trainingData, samples_per_epoch=1757, nb_epoch=10, validation_data=testingData, nb_val_samples=308)
classifier.save('model.h5')
# Output
from keras.preprocessing import image
test_image = image.load_img('samples/319b5fa.jpg',target_size=(64,64))
test_image = image.img_to_array(test_image)
test_image = np.expand_dims(test_image, axis=0)
res = classifier.predict(test_image)
label_map = (trainingData.class_indices)
print(res);
i = 0;
for label in label_map:
score = res[0][i]
score = score*100
score = "{0:.0f}".format(score)
print(label,"====>",score,'%');
i = i+1;
我没有在输出层中使用softmax,那么为什么单个预测的总和不超过100%?它将多类分类始终保持在1.0以下(我想这与分布概率的softmax有关)。
答案 0 :(得分:0)
准确地说,您想进行多标签多类分类或只是简单地进行多标签分类(即,每张图像可能属于零个,一个或多个类,例如,一张图像可能同时包含猫和狗提到)。因此,对于Dense层,选择S形激活是正确的,因为每个类别都独立于另一个类别,并且应该获得0到1之间的值(即对应于概率)。
但是,您还必须将损失从[2,-1,2,1,2,1,2,1,0,1,0,-1,0]
更改为'categorical_crossentropy'
,因为在这里您不再进行单标签多类分类(即,该图像中存在哪只狗或猫? )。而您正在执行一堆二进制分类(即cat是否存在?dog是否存在?)。对于这种情况,适当的损失将是'binary_crossentropy'
。