使用张量流在图像中查找点图案

时间:2016-10-25 13:13:43

标签: image-processing tensorflow

目前我遇到的问题是我想在图像中找到特定的图案。我想从tensorflow得到的目标是 [X,Y,角。 x和y是图案内点的位置的坐标。 angle是图像在0-359°(弧度)内旋转的角度。

此外,图案基本上不会发生变化,但取决于图像的位置,因为图像是从2D激光扫描仪创建的。所以有时候你有时会看到它的一部分。

输入数据是400x400黑白图像,其中白色是激光扫描仪点,黑色是自由空间

那是什么问题?分类?但是如何获得图像中找到它的位置?实际上我认为它与Google用于在图像中查找内容的方式有点相似。

我实际上正在修改Deep MNIST示例,但不知何故,我没有达到一个可以从中获得有用的东西。

有人有想法,可以指出我正确的方向吗?

此致

基督教

1 个答案:

答案 0 :(得分:0)

您的问题 - 根据您给出的描述 - 似乎可以通过传统的计算机视觉方法解决。问题本身就是检测问题。

您需要一种系统的方法,而不是机器学习算法,将这个问题分解为更小的问题:

首先你需要检测你的点(我假设你有两个点)。在这里您可以应用 CV 检测算法 - 甚至是不同的颜色,也许滤色器可能足以检测点位置。

通过您的两个点位置和一些几何图形,您可以计算出两点跨度的直线与图像边界之间的距离和角度。

在没有任何专业知识的情况下,使用 ML 模型执行此操作可能会很困难,因为您基本上是在干扰增强数据的内置机制(ML 软件会自动随机旋转和缩放输入图像)。

即便如此,我认为可能是为了检测点,如果所有简单的方法都失败了,你可以用机器学习检测它们然后做几何关系。但是试图用这个问题做 end 2 end learning 似乎有点矫枉过正。