Question

我正在关注2类图像分类教程here，并希望将其转换为多类分类器。

我正在尝试训练一个模型，以从17个类中预测手表的品牌。 50个纪元后，我的准确度仅为21.88％，所以我不确定自己出了什么问题，甚至我做对了。

这是我的代码：

所有图像都位于/ data或/ valid文件夹下的单独文件夹中。
例如：../ watch finder / data / armani
例2：../ watch finder / data / gucci

import numpy as np
import matplotlib.pyplot as plt
import os
import cv2
from keras.utils import np_utils

from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import keras.optimizers

img_width, img_height = 210, 210

train_data_dir = 'C:/Users/Adrian/Desktop/watch finder/data'
validation_data_dir = 'C:/Users/Adrian/Desktop/watch finder/valid'
nb_train_samples = 4761
nb_validation_samples = 612
epochs = 50
batch_size = 16

model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(17))
model.add(Activation('softmax'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='categorical')
model.fit_generator(
    train_generator,
    samples_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)

这是我的第一个时代

Epoch 1/50
18/18 [==============================] - 8s 422ms/step - loss: 4.1104 - accuracy: 0.0833 - val_loss: 2.8369 - val_accuracy: 0.0592

这是我的第50个/最后一个时代：

Epoch 50/50
18/18 [==============================] - 7s 404ms/step - loss: 2.4840 - accuracy: 0.2188 - val_loss: 3.0823 - val_accuracy: 0.1795

我可以肯定我在这里做错了什么，但是我真的是深度学习的新手，所以我不确定那是什么。感谢所有帮助。

此外，每个品牌的手表都有300-400张图像，并且每个图像尺寸均相同，为210x210。

Answer 1

从高水平看，您的方法似乎没有错。

培训在第50个时期停止了，还是还在学习？如果是这样，那么您可能需要提高学习率，以便更快地训练。

您还需要尝试不同的体系结构并开始调整超参数。

我想说的另一点是您的图像数量很少。尝试使用已建立的架构，您可以为其找到预训练的模型。这些可以帮助您显着提高性能。

最后一点要注意的是，由于您有17个班级，因此如果您的模型是随机预测的，则您的准确率将低于6％。这意味着您的模型至少正在学习一些东西。

如何使用Keras训练多类图像分类器

1 个答案: