Question

我正在尝试建立一个模型来检测输入图像是否为某些图像（例如，狗是否为）。我正在用keras编码，但准确性很差。您有什么想法可以正确调整吗？还是我应该使用除keras之外的其他工具来解决一类分类问题？提前非常感谢您。

这是到目前为止我写的代码和输出。

train_dir = './path/to/train_dir'
vali_dir = './path/to/validation_dir'

train_datagen = ImageDataGenerator(
    rescale=1./255,
    rotation_range=40,
    width_shift_range=0.2,
    height_shift_range=0.2,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=False)

test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
        train_dir, 
        target_size=(150, 150), 
        batch_size=20,
        class_mode='binary')

vali_datagen = ImageDataGenerator(rescale=1./255)

vali_generator = vali_datagen.flow_from_directory(
        vali_dir,
        target_size=(150, 150),
        batch_size=20,
        class_mode='binary')

model = Sequential()
model.add(Conv2D(16, 3, activation='relu', input_shape=(150, 150, 3)))
model.add(MaxPool2D(pool_size=2))
model.add(Conv2D(32, 3, activation='relu'))
model.add(MaxPool2D(pool_size=2))
model.add(Conv2D(64, 3, activation='relu'))
model.add(Flatten())
model.add(Dense(512, activation='relu'))
model.add(Flatten())
model.add(Dense(1024, activation='relu'))
model.add(Dropout(0.2))
model.add(Dense(1, activation='sigmoid'))

model.compile(
        loss='binary_crossentropy',
        optimizer=RMSprop(lr=0.003),
        metrics=['acc']
)

history = model.fit_generator(
        train_generator,
        steps_per_epoch=100,
        epochs=8,
        verbose=2,
        validation_data=vali_generator,
        validation_steps=20
)

输出：

Found 3379 images belonging to 2 classes.
Found 607 images belonging to 2 classes.
Epoch 1/8
 - 136s - loss: 7.6617 - acc: 0.5158 - val_loss: 10.5220 - val_acc: 0.3400
Epoch 2/8
 - 124s - loss: 7.7837 - acc: 0.5118 - val_loss: 10.5220 - val_acc: 0.3400
.......and this is just terrible.

Answer 1

如果输入要素之间没有依赖关系，那么隔离林是一种很好的异常检测算法。但是，如果您输入的是时间序列信号或图像，则最好使用RNN或CNN之类的方法。

我最近遇到了一个名为CNN类的异常检测模型。如果您输入的是图像或时间序列信号，则效果很好。这是他们的github的链接：

https://github.com/raghavchalapathy/oc-nn

Answer 2

应以二进制分类处理。

第二，我想问的是，您是否知道.51准确度意味着51％的准确度，对于第一个时期来说还算不错。

如果您想获得更准确的结果，可以尝试采用转移学习的方法：analytics vidhya

Answer 3

类标签似乎有问题-它们是否与数据正确关联？您可以检查它或发布ImageDataGenerator代码

Answer 4

即使从第一个时期开始，火车的准确度和验证的准确度仍存在很大差异。在我看来，这似乎是一个过度训练的问题。因此，您应该为网络提供更多正规化。就像卷积层内部的更多Dropoutlayers或kernel_regularizer。

Answer 5

我试图更改和调整参数以及训练数据，但是没有得到理想的结果。我遇到了一个使用Isolation forest的类分类。这就是所谓的新颖性检测，在我使用它之后，它的表现非常出色。感谢那些在评论中建议我的人，很抱歉我自己回答。

喀拉拉邦一类分类

5 个答案: