应用错误收集

时间：2018-01-28 18:07:30

标签： computer-vision bounding-box object-recognition

是否有任何方法可以在图像中的对象周围创建多边形（不是矩形）以进行对象识别。

我不是在寻找像this那样的边界矩形。我知道转移学习的概念，使用预先训练的对象识别模型和其他物体检测概念。

主要目标是物体检测，但不是使用边界框而是使用更合适的多边形给出结果。链接某些资源或论文会有所帮助。

答案 0 :(得分：0)

这是一个非常简单（有点hacky）的想法，但它可能有所帮助：采用每像素场景标记算法例如 SegNet，然后转换结果分段将图像转换为二进制图像，其中白色像素是感兴趣的类别（在您的示例中，白色为汽车，黑色为其余）。现在计算边缘。您可以将这些边添加到原始图像，以获得与您想要的结果类似的结果。

答案 1 :(得分：0)

您想要的是图像分割，这与对象检测不同。常见对象类（例如汽车，自行车，人，狗等）的最佳表现方法是使用经过训练的CNN来完成此操作，通常称为语义分段网络awesome links。理论上，这将为您提供与您想要的对象相对应的图像区域。之后，您可以使用所谓的凸包来拟合一个封闭的多边形。