目前,我正在创建一个用于对象检测的深度神经网络,我也创建了自己的数据集,并且我使用边界框来注释我的图像,我的问题是什么是最好的规则我的图像训练的边界框。我的意思是如果我包装我的对象是限制我的对象的背景是好还是我需要找到一种方法来绑定我的对象。
谢谢,
答案 0 :(得分:0)
我不是专门研究边界框,但一般来说,在深度学习中,我们会尝试获得一个能够抵抗无关变量的网络,在您的情况下,背景。边界不应该取决于背景,因此您可以按照自己的方式设置边界框,网络应该学习如何复制它。
最重要的是数据库的大小,并且具有一致的边界而不是精确的边界。
此外,如果您希望您的网络能够抵御背景的变化,那么您应该拥有尽可能多的背景,与边界不相关。
答案 1 :(得分:0)
您可以参考YOLO算法-这是用于物体检测的最佳算法。首先,输入图像将划分为SxS网格单元,Yolo将为每个单元格预测5个边界框,并随每个边界框一起预测,Yolo还将预测该框的中心坐标,宽度,框的高度以及其中具有任何对象的置信度得分框以及该对象属于M类的概率。之后,我们使用Non Max Suppression和IOU来计算具有地面真实性的边界框之间的精度,并仅获得输入图像中对象的最精确边界框。
答案 2 :(得分:0)
没有这样的规则,但是是的,正确注释的最佳实践是在创建边界框时保持一定的像素宽度。
请参阅,背景变化是物体的变化,这将使其变得健壮,但请记住要有足够的样本以正确识别物体的图案(边缘,形状,纹理等)
希望我能解决您的问题!