是否有任何方法可以在图像中的对象周围创建多边形(不是矩形)以进行对象识别。
请参考以下图片: the result I am looking for 和 the original image
我不是在寻找像this那样的边界矩形。我知道转移学习的概念,使用预先训练的对象识别模型和其他物体检测概念。
主要目标是物体检测,但不是使用边界框而是使用更合适的多边形给出结果。链接某些资源或论文会有所帮助。
答案 0 :(得分:0)
这是一个非常简单(有点hacky)的想法,但它可能有所帮助:采用每像素场景标记算法例如 SegNet,然后转换结果分段将图像转换为二进制图像,其中白色像素是感兴趣的类别(在您的示例中,白色为汽车,黑色为其余)。现在计算边缘。您可以将这些边添加到原始图像,以获得与您想要的结果类似的结果。
答案 1 :(得分:0)
您想要的是图像分割,这与对象检测不同。常见对象类(例如汽车,自行车,人,狗等)的最佳表现方法是使用经过训练的CNN来完成此操作,通常称为语义分段网络awesome links。理论上,这将为您提供与您想要的对象相对应的图像区域。之后,您可以使用所谓的凸包来拟合一个封闭的多边形。