初始v3模型如下图所示:
图片来自此博客文章:
https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html
似乎有两个Softmax分类输出。那是为什么?
在TensorFlow示例中使用哪一个作为输出张量,名称为' softmax:0'在这个档案中?
Inception v3模型的学术论文似乎没有这个Inception模型的图像:
http://arxiv.org/pdf/1512.00567v3.pdf
我试图理解为什么网络的这两个分支看起来有两个不同的softmax输出。
感谢您的任何澄清!
答案 0 :(得分:5)
您引用的paper的第4部分是关于辅助分类器。这些是添加到网络较低级别的分类器,通过减轻消失的梯度问题和加速收敛来改善训练。要在训练有素的网络上运行推理,您应该使用模型中名为softmax:0
的主分类器,以及名为auxiliary_softmax:0
的 NOT 辅助分类器。