我正在使用此数据集:http://www.robots.ox.ac.uk/~vgg/data/hands/
然而,我只会使用>面积为4200平方英尺,仅剩下621只手。我意识到这可能还不够如果需要,我会寻找更多图像。但是,所有图像都注释如下:
我有如下边界框的坐标:
然而,边界框未与x&对齐。 y轴。
我相信我必须将手从图像中裁剪出来。我有两种方法可以做到这一点:
1)让xmin和xmax为边界框的最小和最大x坐标。而ymin& ymax是最小值&边界框的最大y坐标。如果这样做,我会得到这个:
(当然没有边界框) 基本上,背景的某些部分仍然在上面。
2)我可以使用二进制掩码“掩盖”边界框内的所有像素。如果我这样做,我的图像大小仍然是从xmin到xmax& ymin到ymax,但是我可以将背景的其余部分设置为白色。
什么会更好?我认为积极因素应该只包含感兴趣的对象(在这种情况下是手),所以留下背景可能不对吗?但是,白色背景可以吗?
这里的主要问题是边界框没有对齐!
答案 0 :(得分:0)
留下少量背景是可以的,每张图片都会有所不同,因此不能作为分类器的一部分创建。
我建议制作一个更大的负片组来取消背景,620张图片就可以了。
答案 1 :(得分:0)
您可能还想查看labelme http://labelme.csail.mit.edu/Release3.0/index.php
我将它用于我的项目,他们还向您展示如何使用亚马逊土耳其人来获取您自己的数据集。我想你也可以使用他们的数据集。