我正在使用神经网络设计OCR算法。我有100个图像([40x20]矩阵)的每个字符,所以我的输入应该是2600x800。我对输入和目标有一些疑问。
1)我的输入是否正确?并且可以按随机顺序使用所有2600张图像吗?
2)目标应该是什么?我是否必须为所有2600个输入定义目标?
3)由于同一角色的目标是单一的,最终的目标向量是什么? (26x800)或(2600x800)?
答案 0 :(得分:0)
26x1
,因此培训的输出应为2600x26
。在每个输出中,你应该为它所属的字符索引为1,其余为零。