如何了解CNN的训练结果?

时间:2019-12-29 15:56:24

标签: neural-network classification conv-neural-network loss-function multilabel-classification

我创建了一个多标签分类CNN,将胸部X射线图像分类为零种或多种可能的肺部疾病。我一直在对其进行一些配置测试并分析其结果,但是我很难理解它的某些方面。

首先,这些是我针对不同配置获得的图表:

Results of CNN with different configurations

注1:我仅更改了每种配置中的数据集大小和颜色通道数 注意2:如果您想知道为什么我要同时测试1和3个颜色通道的网络,那是因为图像在技术上是灰度的,但是我使用的是AlexNet体系结构,该体系结构采用224 x 224图像作为输入3个频道,所以我想看看网络在3个频道而不是仅3个频道上的表现是否更好

这些是我不了解的事情:

  1. 为什么不同时期之间网络的敏感性和特异性差异如此之大?
  2. 随着时期数的增加,网络验证损失几乎没有变化是正常现象吗?
  3. 看看我得到的结果,似乎有2个时期是最好的结果。那有意义吗?我听说有人有时会训练几十个网络。
  4. 为什么在许多时期之间网络的敏感性增加时,特异性趋于降低,反之亦然?

很抱歉,如果其中一些问题愚蠢,我仍然是一个新手。而且,我的总数据集大大超过了我在这些结果中显示的数据(〜110,000张图像)。由于网络训练需要时间,我只是没有用更多图像进行测试。

网络体系结构:

  • 基本体系结构:AlexNet
  • 损失函数:S型交叉熵损失
  • Optimizer:学习率为0.001的Adam优化算法

编辑:我忘了提到要预测的疾病数量为15,并且由于类的不平衡,网络看到的0远远大于1。因此,我考虑过将损失函数更改为S型交叉熵的加权形式,但是我不确定这是否会对网络有很大帮助。

0 个答案:

没有答案