python - 如何为深度学习训练数据集创建地面真相边界框？

边界框通常用手工标记。大多数有深度学习的人使用单独的应用程序进行标记。我相信这个程序包很受欢迎：

我开发了自己的用于标签的RoR解决方案，因为在多个人之间分发工作很有帮助。如果您想看一下，该存储库是开放源代码：

我认为称之为“编码像素”有点误导。边界框是标记的矩形数据类型，这意味着它们完全由矩形（角叉车，公共汽车，卡车）的类型和矩形角的（x，y）坐标定义。

用于定义边界框的软件通常由图像显示元素以及允许用户在UI上拖动边界框的功能组成。我的应用程序使用单选按钮列表来选择对象类型（汽车，公共汽车等）。然后用户绘制一个边界框。

完全标记图像的结果是一个文本文件，其中每一行代表一个边界框。您应该查看库文档中的训练算法，以准确了解输入边界框所需的格式。

在我自己的应用程序中，我开发了一些功能来比较来自不同用户的边界框。在任何大型ML工作中，您可能会遇到一些贴错标签的图像，因此，您确实需要一种工具来识别此图像，因为它会严重降低您的结果。