OpenCV分类神经网络+图像展平问题

时间:2020-07-11 19:47:04

标签: c++ opencv image-processing neural-network conv-neural-network

没有简单的方法可以解释他,所以我会讲清楚。

对于神经网络,对我来说将彩色图像展平到0到1之间像这样更好:0.RRRGGGBBBAAA而像素(例如0)将是.255000000255,这意味着在位置上有一个红色像素0,或者只是将HSV脱粒,然后将灰度调整为介于0和1之间的灰色?

一些背景。我建立了所谓的PxlDbl或Pixel Double的拼写形式,它的确切发音是……在0到.255255255255之间的单个double中的像素颜色是最大值。为什么要加倍?浮点数没有实现该目标所需的精度。我目前有一个自定义神经网络,其中每个拓扑层都使用许多激活函数。我正在使用的图像是众所周知的Sigmoid,它的取值范围是0到1。我的最终目标和问题是将某种扁平化的图像放入此网络中。我的问题确实与扁平化的最佳方法有关。我是否应该将图像大小乘以4,然后为每个像素的每个颜色通道都有一个神经元?我可以取0到255之间的值并将其映射到0到1之间,这将有效地为我提供所需的内容,但是说一个600x400的图像x4通道在第一层中会产生960,000个神经元,即使就我个人而言,也是如此无论我对网络编程的程度如何,都无法实现正常工作...通过理论上的PxlDbl,它可以将神经元缩小到600x400的图像大小,只有240,000个神经元,就重量等方面而言,更易于管理。我唯一关心的是输入要精确到我的输出,因为它们的分类可能很难训练,即在像.255 ^ 128076255之后,它可能会在训练中掉落128076255,因为它不能做到那么精确数字。

在此方面的帮助将不胜感激...

0 个答案:

没有答案