我已经阅读了neural networks and deep learning中的chap1,部分"一个简单的网络,用于对手写数字进行分类" (你可以用ctrl-f搜索),我发现一个很好的问题:"为什么我们应该在输出层使用10个神经元,而不是4个神经元?"
对于4个神经元,每个神经元具有值0或1,然后表示2 ^ 4 = 16> 1。 10.那么,为什么我们不在输出层使用4个神经元?
答案 0 :(得分:5)
每个输出神经元负责单个数字。输出神经元i
(总共10个神经元)将返回输入数字为[0,1)
的概率i
。这样,当您将它们用作位时,您就知道每个数字的概率分布而不仅仅是单个输出(如您的示例中的2 ^ 4)。