Question

我正在尝试运行一个人群估计模型，该模型根据图像中的人数将图像分为三个不同的大类。 1200 张图像用于训练，其中 20% 用于验证。我使用 sentdex's tutorial on Youtube 作为参考将图像数据加载到模型中；我将图像作为 zip 文件加载、解压缩并根据它们所在的文件夹对它们进行分类。

我的问题是，每当我尝试训练模型时，我注意到损失和验证损失始终为 0，这导致模型没有完全训练并且验证准确度始终保持不变，如{{3 }}。我怎样才能让损失真正改变？我在实施方面做错了什么吗？

到目前为止，我尝试的是：

我尝试添加第三个卷积层，但收效甚微。
我还尝试将最后一个 Dense 层更改为 model.add(Dense(3))，但出现错误，提示“Shapes (None, 1) 和 (None, 3) 不兼容”
我尝试使用较低的学习率（0.001？），但模型最终返回 0 以验证准确性
更改优化器似乎没有为我带来任何变化

以下是迄今为止我的代码片段，显示了我的模型尝试：

import keras.backend as K

logdir = "logs/scalars/" + datetime.now().strftime("%Y%m%d-%H%M%S")
tensorboard_callback = keras.callbacks.TensorBoard(log_dir=logdir)

X = X/255.0

model = Sequential()
model.add(Conv2D(64, (3,3), input_shape = X.shape[1:])) #[1:] to skip the -1
model.add(Activation("relu"))
model.add(Conv2D(64, (3,3), input_shape = X.shape[1:])) #[1:] to skip the -1
model.add(Activation("relu"))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Conv2D(128, (3,3)))
model.add(Activation('relu'))
model.add(Conv2D(128, (3,3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2,2)))

model.add(Dropout(0.2))

model.add(Flatten()) 

model.add(Dense(128))
model.add(Activation('relu'))

#fully connected layer 
model.add(Dense(1))
model.add(Activation('softmax'))

opt = keras.optimizers.Adam(lr=0.01)

model.compile(loss='categorical_crossentropy', 
              optimizer = opt,
              metrics=['accuracy']) 

model.fit(x_train, y_train, batch_size = 100, epochs = 30, validation_data = (x_val, y_val),  callbacks=[tensorboard_callback], shuffle=True)

可以在 Colab here 上找到完整的代码。

Answer 1

你的最后一层包含一个节点，所以你只输出一个数字。但是，您需要输出 3 个数字，因为您有 3 个类。这些输出中的每一个都对应于该特定类别的非归一化概率。 softmax之后，你得到归一化的概率分布。

Answer 2

您有 3 个课程。因此更改代码

model.add(Dense(1))

到

model.addDense(3))

现在，如果您使用模型对图像进行预测，model.predict 将生成包含 3 个概率值的列表。这些概率的总和将是 1.0。模型的实际预测是列表中具有最高概率值的索引。例如，如果 model.predict 的输出是 [.1, .7。 .2] 概率值为 0.7 的索引 1 是预测类别。您的类被索引为 0、1、2，因此模型预测类 1。您可以获得模型输出的预测类。用

预测

class_index=np.argmax(model,predict(....))

某处你可能有一个类似的类列表

classes=['less_than 5', 'between 5 and 10', 'more than 10']

所以实际预测的类名是

predicted_class=classes[class_index]

Keras CNN 模型中的零损失和验证损失

2 个答案: