初始模型是否有两个softmax输出?

时间:2016-09-06 14:56:11

标签: tensorflow deep-learning softmax

初始v3模型如下图所示:

Inception v3 Model

图片来自此博客文章:

https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html

似乎有两个Softmax分类输出​​。那是为什么?

在TensorFlow示例中使用哪一个作为输出张量,名称为' softmax:0'在这个档案中?

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/models/image/imagenet/classify_image.py

Inception v3模型的学术论文似乎没有这个Inception模型的图像:

http://arxiv.org/pdf/1512.00567v3.pdf

我试图理解为什么网络的这两个分支看起来有两个不同的softmax输出。

感谢您的任何澄清!

1 个答案:

答案 0 :(得分:5)

您引用的paper的第4部分是关于辅助分类器。这些是添加到网络较低级别的分类器,通过减轻消失的梯度问题和加速收敛来改善训练。要在训练有素的网络上运行推理,您应该使用模型中名为softmax:0的主分类器,以及名为auxiliary_softmax:0 NOT 辅助分类器。