关于神经网络中输入和目标的分配

时间:2015-03-24 06:09:14

标签: matlab neural-network ocr

我正在使用神经网络设计OCR算法。我有100个图像([40x20]矩阵)的每个字符,所以我的输入应该是2600x800。我对输入和目标有一些疑问。

1)我的输入是否正确?并且可以按随机顺序使用所有2600张图像吗?

2)目标应该是什么?我是否必须为所有2600个输入定义目标?

3)由于同一角色的目标是单一的,最终的目标向量是什么? (26x800)或(2600x800)?

1 个答案:

答案 0 :(得分:0)

  1. 您的输入应该是正确的。你有(我猜)每个有26个字符和100个大小为800的图像,因此矩阵看起来很好。作为旁注,看起来输入大小相当大,您可能需要考虑使用PCA并使用特征值进行训练或仅减小图像的大小。我已经能够用10x10图像训练NN,但更大= =更难。尝试,如果它不起作用尝试做PCA。
  2. (和3)当然,如果你想训练NN,你需要输入输出,你还要怎么训练?您的每个图像的输出大小应为26x1,因此培训的输出应为2600x26。在每个输出中,你应该为它所属的字符索引为1,其余为零。