tensorflow - 深入学习形状定位和识别

深入学习形状定位和识别

时间：2017-05-11 15:26:39

标签： tensorflow computer-vision deep-learning theano caffe

有一组图像，每个图像包含不同的形状实体，如下图所示。我正在尝试本地化并识别这些不同的形状。例如，为每个不同的形状添加边界框，甚至可以标记它。有哪些主要的研究论文/深度学习模型能够解决这类问题？

2 个答案:

答案 0 :(得分：0)

如果您倾向于使用深度学习方法，rcnn，更快的rcnn，yolo和ssd等对象检测文件可以帮助您解决这个问题。

很容易说这是一个微不足道的问题，可以通过OpenCV中的工具解决，深度学习是矫枉过正的，但我可以看到很多理由使用深度学习工具而且没有回答你的问题。

答案 1 :(得分：0)

我们假设你的形状有不同的比例和旋转。实际上，上面显示的主图像对于训练过程来说非常大，并且需要大量的训练样本才能在测试样本结束时产生良好的准确性。在这种情况下，最好在短图像（如128x128）上训练卷积神经网络，每个图像只有一个形状，然后使用滑动技巧！ 该项目将有三个主要步骤：

生成测试和训练样本，每个图像应该只有一个形状
训练分类器以识别每个输入图像中的单个形状
使用幻灯片技巧！将包含许多形状的原始图像分解为大小为128x128的重叠块。将每个区块传递给第二步训练的模型。

通过这种方式，您可以在训练模型中为每个形状添加标签，并且您还可以使用滑动技巧获得每个形状的位置。对于分类器，您可以使用Tensorflow MNIST教程的CNN结构。这是一种纸张，与指纹图像应用完全相同的方法来提取局部特征。 A direct fingerprint minutiae extraction approach based on convolutional neural networks