理论上哪种方法最好?

时间:2015-03-01 16:17:08

标签: neural-network ocr

说我想用神经网络识别我的角色。让我们把它切成5个字母,图像的二进制形式为16x16,输入+2层网络,两个层内的单极性功能。动量反向传播用于学习过程。

以下哪种方法应该给出最好的结果(其中x是第一层中神经元的数量)?我认为最好的正确识别百分比。速度不是这个问题的一个因素。

  1. 单个网络,256; x; 5 - 最高值神经元获胜。
  2. 5个网络,256; x; 1 - 每个网络都有自己的字母,每个输出都经过测试与阈值相关,可能会发生2个或更多网络将图像识别为“他们自己的”
  3. 同上,但现在每个网络的输出都被归一化(如果a,b,c,d,e是输出,那么a = a /(a + b + c + d + e); b = b /(a + b + c + d + e)等等)

1 个答案:

答案 0 :(得分:1)

2是最糟糕的选择,因为" 2个或更多网络将图像识别为"他们自己的""肯定会多次发生,以及你之后如何在他们之间进行判断? 1将合理地工作。 3是softmax输出函数背后的基本思想,softmax通常最适用于分类任务,特别是与交叉熵误差函数结合使用时。