假设我有一个方法或其他神经网络正确地对图像进行模式检测。我应该如何设计一个图像中有多个图案的神经网络?
假设在图像中有待检测的X模式,最佳方法是什么? AFAIK输出层神经元值应为[-1,1]。我怎么知道是否识别出X量的图案?这是否意味着我必须设置一个硬编码限制,它可以识别多少个模式(因为输出神经元的数量是固定的)?
答案 0 :(得分:0)
以下是使用面部检测作为示例的建议。 Github上的这个Face Detection link被描述为使用Haar分类器检测多重模式(即面部)。如果您在实施部分下阅读,则表明该算法使用scaleOption
和templateSizeOption
参数(以及其他参数)来管理图像中检测到的面数。听起来你应该在给定图像的子空间或窗口中寻找特征(甚至可能是重叠的空间)。
scaleOption - 此参数用于指定 haar特征使用的速率 用于面部检测将被缩放。一个 较低规模的选择意味着更多 面部将被检测到,而更高 比例选项将执行得更快 检测,但可能会错过一些面孔 来自输入图像。默认 比例值为1.1,即确定一个 增加特征维度 每一步都要10%。
templateSizeOption - 它已经习惯了 指定最小的区域 寻找一张脸。如果我们想 从特写图像中检测人物, 尺寸应该超过40像素, 否则是25个区域的像素(即 默认值)足够了 检测大量的面孔。
答案 1 :(得分:0)
这样做使用hopfild net.at首先在相同的窗口中提取你的目标并保存在你的网中。然后在你的图像中进行简单的算法搜索,并在任何时候将网络的sim与目标进行比较,并且对于任何目标使用单独的数组来保存结果。最后提取每个数组中最近的模式。你可以使用一些图像在开始之前以原始图像进行处理。
答案 2 :(得分:0)
是的,这可以通过神经网络来完成。我认为最实用的解决方案是将神经网络应用于扫描图像的窗口。来自神经网络的多次命中将意味着图像中有多个目标对象。
顺便提一下,神经网络不必位于-1 .. 1的范围内。