应用错误收集

时间：2015-03-24 06:09:14

标签： matlab neural-network ocr

我正在使用神经网络设计OCR算法。我有100个图像（[40x20]矩阵）的每个字符，所以我的输入应该是2600x800。我对输入和目标有一些疑问。

1）我的输入是否正确？并且可以按随机顺序使用所有2600张图像吗？

2）目标应该是什么？我是否必须为所有2600个输入定义目标？

3）由于同一角色的目标是单一的，最终的目标向量是什么？（26x800）或（2600x800）？

答案 0 :(得分：0)

您的输入应该是正确的。你有（我猜）每个有26个字符和100个大小为800的图像，因此矩阵看起来很好。作为旁注，看起来输入大小相当大，您可能需要考虑使用PCA并使用特征值进行训练或仅减小图像的大小。我已经能够用10x10图像训练NN，但更大= =更难。尝试，如果它不起作用尝试做PCA。
（和3）当然，如果你想训练NN，你需要输入输出，你还要怎么训练？您的每个图像的输出大小应为26x1，因此培训的输出应为2600x26。在每个输出中，你应该为它所属的字符索引为1，其余为零。