答案 0 :(得分:0)
假设我们有一个w * h像素的图像(w =宽度,h =高度)。
最直接的方法是简单地创建w * h * 3输入节点;对于每个像素,三个输入节点(一个用于R值,一个用于G值,一个用于B值)。有了足够大的训练数据集,以这种方式分割数据应该不会有问题。
你最初确实丢失了一些信息是正确的;在网络结构中没有任何内在的东西告诉它前三个输入节点以某种方式相互关联(相同的像素),之后也是三个,等等。给定足够大量的训练数据它应该(理论上)能够接受这样的模式。
根据问题域,简单地删除颜色信息也可能是有益的。相反,您可以将图像转换为灰度,然后每个像素只需要一个输入节点。显然你也会以这种方式丢失信息,但是对于某些任务来说,信息可能不是必需的(并且摆脱它可以使你的训练在计算上更有效率)。