利用rotated_rectangle/bounding_box GT 获得分割掩码GT

时间:2021-05-12 08:48:32

标签: python opencv machine-learning computer-vision object-detection

TLDR; 一般来说,在给定旋转矩形/边界框的情况下,提取/预测分割掩码有哪些可用选项?


主题:

我有一个小的图像数据集,每个图像包含 100 多个小实例(最多 300 个),这些实例已经使用框进行了注释,因为它比绘制蒙版容易得多。未来的工作涉及扩展数据集并通过额外提供分割掩码来丰富注释 .. :O pff

我的概念:

所以我在想,由于对象被遮挡并且有时被隐藏,所以使用更适合其空间布局的旋转矩形手动注释它们,而不是将分割掩码绘制到超过数千个(不要惊慌 - 有一个团队!)。下一步是使用当前注释信息在包含单个实例的子图片中分割带注释的图片,并可能将它们传递给语义(/pixel_wise)分割模型,以便检索它们遮罩并将它们重新映射到整个画面。因此,通过在检索到的掩码中应用一些更正,从而节省注释阶段的时间和精力。


问题:

对于如何利用bounding_box的可用信息实现segmentation_mask提取有什么建议吗? 分割模型基于线性的分割(例如,使用 cv 基于直方图可能更可行,但可能不能很好地概括),完全不同的概念< /strong>

提前致谢!

0 个答案:

没有答案