我目前正在使用java库对离线手写识别进行一些天真的实验。我给我的程序提供了一个预先写好的英语句子的图像,并将其分成单个字符,然后我将其提供给一个非常天真的神经网络。
我对神经网络的想法很新,所以我的问题是从优化这个网络的超参数开始。目前它是一个简单的前馈网络,我使用弹性传播进行训练,因此我可以优化的唯一参数是隐藏层的数量和每个隐藏层中的神经元数量。我当然可以通过大量但有限数量的组合进行详尽的搜索,但这将非常耗时,而且我相信那些在这门艺术中更有见识的人必须能够指出我的权利方向。
我在这里的某个地方发现了一个帖子,说明一个好的起点,任何网络一般只使用一个隐藏层,神经元数量等于输入和输出层中神经元的平均数量,这就是什么我现在正在做。
我使用此型号可获得约40-60%(取决于角色)精度的表现。