我正在关注2类图像分类教程here,并希望将其转换为多类分类器。
我正在尝试训练一个模型,以从17个类中预测手表的品牌。 50个纪元后,我的准确度仅为21.88%,所以我不确定自己出了什么问题,甚至我做对了。
这是我的代码:
所有图像都位于/ data或/ valid文件夹下的单独文件夹中。
例如:../ watch finder / data / armani
例2:../ watch finder / data / gucci
import numpy as np
import matplotlib.pyplot as plt
import os
import cv2
from keras.utils import np_utils
from keras.preprocessing.image import ImageDataGenerator
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import keras.optimizers
img_width, img_height = 210, 210
train_data_dir = 'C:/Users/Adrian/Desktop/watch finder/data'
validation_data_dir = 'C:/Users/Adrian/Desktop/watch finder/valid'
nb_train_samples = 4761
nb_validation_samples = 612
epochs = 50
batch_size = 16
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=input_shape))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Flatten())
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(17))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy',
optimizer='rmsprop',
metrics=['accuracy'])
train_datagen = ImageDataGenerator(
rescale=1. / 255,
shear_range=0.2,
zoom_range=0.2,
horizontal_flip=True)
test_datagen = ImageDataGenerator(rescale=1. / 255)
train_generator = train_datagen.flow_from_directory(
train_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='categorical')
validation_generator = test_datagen.flow_from_directory(
validation_data_dir,
target_size=(img_width, img_height),
batch_size=batch_size,
class_mode='categorical')
model.fit_generator(
train_generator,
samples_per_epoch=nb_train_samples // batch_size,
epochs=epochs,
validation_data=validation_generator,
validation_steps=nb_validation_samples // batch_size)
这是我的第一个时代
Epoch 1/50
18/18 [==============================] - 8s 422ms/step - loss: 4.1104 - accuracy: 0.0833 - val_loss: 2.8369 - val_accuracy: 0.0592
这是我的第50个/最后一个时代:
Epoch 50/50
18/18 [==============================] - 7s 404ms/step - loss: 2.4840 - accuracy: 0.2188 - val_loss: 3.0823 - val_accuracy: 0.1795
我可以肯定我在这里做错了什么,但是我真的是深度学习的新手,所以我不确定那是什么。 感谢所有帮助。
此外,每个品牌的手表都有300-400张图像,并且每个图像尺寸均相同,为210x210。
答案 0 :(得分:2)
从高水平看,您的方法似乎没有错。
培训在第50个时期停止了,还是还在学习?如果是这样,那么您可能需要提高学习率,以便更快地训练。
您还需要尝试不同的体系结构并开始调整超参数。
我想说的另一点是您的图像数量很少。尝试使用已建立的架构,您可以为其找到预训练的模型。这些可以帮助您显着提高性能。
最后一点要注意的是,由于您有17个班级,因此如果您的模型是随机预测的,则您的准确率将低于6%。这意味着您的模型至少正在学习一些东西。