Question

因此，我正在尝试创建一个CNN，该CNN可以预测X射线胸腔图像中是否有“支持设备”，但是在训练我的模型时，似乎没有学到任何东西。

我正在使用一个名为“ CheXpert”的数据集，该数据集可以使用20万多个图像。经过一些“清理”后，最终的数据集最终得到100.000张图像。就模型而言，我导入了vgg16预训练模型的卷积基础，并添加了我自己的2个完全连接的层。然后，我冻结了所有的卷积基础，仅使可训练的完全连接的层成为可训练层。这是代码：

from keras.layers import GlobalAveragePooling2D
from keras.models import Model

pretrained_model = VGG16(weights='imagenet', include_top=False)

pretrained_model.summary()

for layer in pretrained_model.layers:
    layer.trainable = False

x = pretrained_model.output
x = GlobalAveragePooling2D()(x)

dropout = Dropout(0.25)

# let's add a fully-connected layer
x = Dense(1024, activation='relu')(x)
x = dropout(x)
x = Dense(1024, activation = 'relu')(x)
predictions = Dense(1, activation='sigmoid')(x)

final_model = Model(inputs=pretrained_model.input, outputs=predictions)

final_model.compile(loss='binary_crossentropy', optimizer='rmsprop', metrics=['accuracy'])

据我所知，正常的行为应该是精度应该从低开始，然后随着时代的发展而增长。但是在这里，它仅通过相同的值（0.93和0.95）振荡。抱歉，我无法上传图像以向您显示图表。

总而言之，我想知道准确性的微小差异是否意味着该模型没有学习任何东西。

我有一个假设：在数据集的所有100.000张图像中，有95.000个具有标签“ 1”，只有5.000个具有标签“ 0”。我认为，如果将图像缩小为“ 1”，将其等同于图像为“ 0”，则结果将发生变化。

Answer 1

缺少标记为“ 0”的图像对CNN毫无帮助。我还建议降低学习率，并尝试批量大小以查看是否有所变化。希望对您有帮助。

Answer 2

由于训练数据不平衡，建议您在训练步骤中设置“ class_weight”。您拥有的数据越多，您设置的class_weight越低。

class_weight = {0: 1.5, 1: 0.5}
model.fit(X, Y, class_weight=class_weight)

您可以在keras document中检查class_weight的增加量。

class_weight：可选的字典将类索引（整数）映射到权重（浮动）值，用于对损失函数（在仅培训）。这可能有助于告诉模型“支付更多注意”来自代表性不足的班级的样本。

我如何改善CNN的准确性？

2 个答案: