c++ - OpenCV分类神经网络+图像展平问题

没有简单的方法可以解释他，所以我会讲清楚。

对于神经网络，对我来说将彩色图像展平到0到1之间像这样更好：0.RRRGGGBBBAAA而像素（例如0）将是.255000000255，这意味着在位置上有一个红色像素0，或者只是将HSV脱粒，然后将灰度调整为介于0和1之间的灰色？

一些背景。我建立了所谓的PxlDbl或Pixel Double的拼写形式，它的确切发音是……在0到.255255255255之间的单个double中的像素颜色是最大值。为什么要加倍？浮点数没有实现该目标所需的精度。我目前有一个自定义神经网络，其中每个拓扑层都使用许多激活函数。我正在使用的图像是众所周知的Sigmoid，它的取值范围是0到1。我的最终目标和问题是将某种扁平化的图像放入此网络中。我的问题确实与扁平化的最佳方法有关。我是否应该将图像大小乘以4，然后为每个像素的每个颜色通道都有一个神经元？我可以取0到255之间的值并将其映射到0到1之间，这将有效地为我提供所需的内容，但是说一个600x400的图像x4通道在第一层中会产生960,000个神经元，即使就我个人而言，也是如此无论我对网络编程的程度如何，都无法实现正常工作...通过理论上的PxlDbl，它可以将神经元缩小到600x400的图像大小，只有240,000个神经元，就重量等方面而言，更易于管理。我唯一关心的是输入要精确到我的输出，因为它们的分类可能很难训练，即在像.255 ^ 128076255之后，它可能会在训练中掉落128076255，因为它不能做到那么精确数字。

在此方面的帮助将不胜感激...

OpenCV分类神经网络+图像展平问题

0 个答案: