我正致力于光学字符识别问题。我已经成功提取了[1X32]矩阵的特征(我从每个分段字符中提取了32个特征)。我提供了完整的训练数据集(每个角色的图像),但是我在创建输入和放大器时打破了我的头脑。目标数据集矩阵。所以请告诉我这些矩阵,测试数据和&我将以什么格式从神经网络获得输出。
1)有258种不同的模式(字符),那么,应该有258个类标签吗?
我的输入矩阵大小是行数= 32(要素)cols数量= 258 * 4 = 1032(字符数*每个字符的实例数没有)
2)目标矩阵的大小应该是多少?只为我的案例绘制一个虚拟目标矩阵。
答案 0 :(得分:0)
您是否已经检查了MATLAB的神经网络工具箱(http://www.mathworks.co.uk/help/nnet/examples/crab-classification.html?prodcode=NN&language=en)?在那里你可以找到一些如何使用神经网络的例子。
关于你的两个具体问题:
1)通常,如果要区分N个不同的字符,则需要大量的类标签。所以在你的情况下,你应该有258个类标签。使用神经网络的分类问题的输出通常是二进制输出,其中一个用于识别的类,0用于剩余的类。但是,如果使用sigmoid函数作为最后一个激活函数,输出节点都不是0或1,那么可能会发生这种情况,在这种情况下,您可以获取所有输出节点的最大值,以获得最高或更可能的类对于某种输入。
2)目标矩阵应该是一个二进制矩阵,其中1表示正确的类,0表示每个输入的所有其他类。所以在你的情况下它应该是258 * 1032矩阵。我再次建议您查看上面给出的链接。
祝你好运。