带有Tensorflow的多边形边界框

时间:2017-12-24 20:13:44

标签: python python-3.x tensorflow object-detection

据我所知,用于训练自定义对象检测数据集的tensorflow API仅使用矩形边界框,即xmin,xmax,ymax,ymin。我也明白,多边形边界框将大大提高检测精度,因为它可以在边界框内删除任何不必要的信息,从而获得更优越的训练数据集。我目前使用labelImg绑定我的所有图像进行训练,它确实提供了多边形框。我的问题是,有没有办法修改tensorflow API中的代码以使用多边形框而不是矩形框?

1 个答案:

答案 0 :(得分:0)

不,此时您可能对Mask R-CNN等语义分割更感兴趣(未在Tensorflow的对象检测API中实现).API中的模型具有特定的可区分层(因此可训练)边界框。多边形模型的自由度会更复杂。掩码R-CNN通过识别对象在某种程度上解决了多边形问题,然后将边界框内的内容实际上分割为对象与背景。

这里介绍一些用于对象检测的常用算法及其工作原理:

https://blog.athelas.com/a-brief-history-of-cnns-in-image-segmentation-from-r-cnn-to-mask-r-cnn-34ea83205de4?gi=b386f4274020