如何使用Keras训练多类图像分类器

时间:2020-04-05 21:48:10

标签: python machine-learning keras deep-learning

我正在关注2类图像分类教程here,并希望将其转换为多类分类器。

我正在尝试训练一个模型,以从17个类中预测手表的品牌。 50个纪元后,我的准确度仅为21.88%,所以我不确定自己出了什么问题,甚至我做对了。

这是我的代码:

所有图像都位于/ data或/ valid文件夹下的单独文件夹中。
例如:../ watch finder / data / armani
例2:../ watch finder / data / gucci

import numpy as np
import matplotlib.pyplot as plt
import os
import cv2
from keras.utils import np_utils

from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import keras.optimizers

img_width, img_height = 210, 210

train_data_dir = 'C:/Users/Adrian/Desktop/watch finder/data'
validation_data_dir = 'C:/Users/Adrian/Desktop/watch finder/valid'
nb_train_samples = 4761
nb_validation_samples = 612
epochs = 50
batch_size = 16

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(17))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')
model.fit_generator(
    train_generator,
    samples_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)

这是我的第一个时代

Epoch 1/50
18/18 [==============================] - 8s 422ms/step - loss: 4.1104 - accuracy: 0.0833 - val_loss: 2.8369 - val_accuracy: 0.0592

这是我的第50个/最后一个时代:

Epoch 50/50
18/18 [==============================] - 7s 404ms/step - loss: 2.4840 - accuracy: 0.2188 - val_loss: 3.0823 - val_accuracy: 0.1795

我可以肯定我在这里做错了什么,但是我真的是深度学习的新手,所以我不确定那是什么。 感谢所有帮助。

此外,每个品牌的手表都有300-400张图像,并且每个图像尺寸均相同,为210x210。

1 个答案:

答案 0 :(得分:2)

从高水平看,您的方法似乎没有错。

培训在第50个时期停止了,还是还在学习?如果是这样,那么您可能需要提高学习率,以便更快地训练。

您还需要尝试不同的体系结构并开始调整超参数。

我想说的另一点是您的图像数量很少。尝试使用已建立的架构,您可以为其找到预训练的模型。这些可以帮助您显着提高性能。

最后一点要注意的是,由于您有17个班级,因此如果您的模型是随机预测的,则您的准确率将低于6%。这意味着您的模型至少正在学习一些东西。