我需要能够确定是否正确或不正确地绘制了一个形状,
我有形状的样本数据,它保存形状和像素的顺序(用像素的颜色表示)
例如,您可以看到下采样图像和颜色变化
我无法确定我需要定义的网络,以接受此类培训输入。
我应该将sampledown图像转换为矩阵并输入吗?让我们说我的图像是64x64,我需要64x64输入神经元(如果我忽略像素的颜色,那我觉得)是可行的解决方案吗?
如果您有任何指导,我可以使用它:)
答案 0 :(得分:3)
我给你举了一个例子如下。
它是字母c
的二值化4x4图像。您可以连接行或列。我按列连接,如图所示。然后将每个像素映射到输入神经元(总共16个输入神经元)。在输出图层中,我有26个输出,字母a
到z
。
注意,在图中,为简单起见,我没有将所有节点从层i
连接到层i+1
,您可能应该将它们全部连接起来。
在输出层,我突出显示c
的节点,以指示对于此训练实例,c
是目标标签。预期的输入和输出向量列在图的底部。
如果要保持颜色强度,例如R / G / B,则必须将输入数量增加三倍。每个像素被三个神经元替换。
希望这会有所帮助。为了进一步阅读,我强烈建议Andrew Ng在here - UFLDL进行深度学习教程。这是图像识别问题的现状。在本教程的练习中,您将接受严格的培训,对图像进行预处理,并使用大量的图像处理工程技巧,以及端到端的有趣的深度学习算法。