我一直在研究神经网络,特别是这个令人难以置信的online book提供的建议。在提供的示例网络中,我们展示了如何创建一个神经网络,对MNIST training data进行分类以执行Optical Character Recognition (OCR)。
配置网络,使得输入刺激表示来自24×24图像的离散范围的阈值像素数据;在输出端,我们有十个信号路径,代表输入图像的每个不同解决方案;这些用于将手写数字从零到九分类。在此实现中,手写的“3”将沿第三个输出路径驱动强信号。
现在,我已经看到神经网络可以应用于更多'不可预测的'输出解决方案;例如,让教授网络的团队认识到人类的头发:
当然,在上面的应用程序中,我们无法使用固定的输出数组长度,因为在图像中符合条件的点数在不同样本之间会有很大差异。任何人都可以推荐用什么样的模式来实现这个目标?
为了完整性,我打算建议团队可以使用一种“跟随机器人”来进行分类任务。因此,对于输入图像,可以使用一小部分离散命令(LEFT
,RIGHT
,UP
,DOWN
)训练网络一段固定时间{{ 1}}并训练网络以像 Etch-a-Sketch 一样控制机器人。
或者,我们可以实现一个一对一地映射像素的网络,并定义各个像素是否有助于头发;但这与不同的图像分辨率不兼容。
那么,这些解决方案中的任何一个听起来都合理吗?如果是这样,这类问题的已知通用解决方案的这些基本实现是什么?你会用什么方法?