据我所知,用于训练自定义对象检测数据集的tensorflow API仅使用矩形边界框,即xmin,xmax,ymax,ymin。我也明白,多边形边界框将大大提高检测精度,因为它可以在边界框内删除任何不必要的信息,从而获得更优越的训练数据集。我目前使用labelImg绑定我的所有图像进行训练,它确实提供了多边形框。我的问题是,有没有办法修改tensorflow API中的代码以使用多边形框而不是矩形框?
答案 0 :(得分:0)
不,此时您可能对Mask R-CNN等语义分割更感兴趣(未在Tensorflow的对象检测API中实现).API中的模型具有特定的可区分层(因此可训练)边界框。多边形模型的自由度会更复杂。掩码R-CNN通过识别对象在某种程度上解决了多边形问题,然后将边界框内的内容实际上分割为对象与背景。
这里介绍一些用于对象检测的常用算法及其工作原理: