深入学习形状定位和识别

时间:2017-05-11 15:26:39

标签: tensorflow computer-vision deep-learning theano caffe

有一组图像,每个图像包含不同的形状实体,如下图所示。我正在尝试本地化并识别这些不同的形状。例如,为每个不同的形状添加边界框,甚至可以标记它。有哪些主要的研究论文/深度学习模型能够解决这类问题? enter image description here

2 个答案:

答案 0 :(得分:0)

如果您倾向于使用深度学习方法,rcnn,更快的rcnn,yolo和ssd等对象检测文件可以帮助您解决这个问题。

很容易说这是一个微不足道的问题,可以通过OpenCV中的工具解决,深度学习是矫枉过正的,但我可以看到很多理由使用深度学习工具而且没有回答你的问题。

答案 1 :(得分:0)

我们假设你的形状有不同的比例和旋转。实际上,上面显示的主图像对于训练过程来说非常大,并且需要大量的训练样本才能在测试样本结束时产生良好的准确性。在这种情况下,最好在短图像(如128x128)上训练卷积神经网络,每个图像只有一个形状,然后使用滑动技巧! 该项目将有三个主要步骤:

  1. 生成测试和训练样本,每个图像应该只有一个形状
  2. 训练分类器以识别每个输入图像中的单个形状
  3. 使用幻灯片技巧!将包含许多形状的原始图像分解为大小为128x128的重叠块。将每个区块传递给第二步训练的模型。
  4. 通过这种方式,您可以在训练模型中为每个形状添加标签,并且您还可以使用滑动技巧获得每个形状的位置。 对于分类器,您可以使用Tensorflow MNIST教程的CNN结构。 这是一种纸张,与指纹图像应用完全相同的方法来提取局部特征。 A direct fingerprint minutiae extraction approach based on convolutional neural networks

相关问题