我应该如何准备用于手部检测的HAAR训练的正面图像?

时间:2013-06-13 11:17:16

标签: matlab opencv image-processing computer-vision face-detection

我正在使用此数据集:http://www.robots.ox.ac.uk/~vgg/data/hands/

然而,我只会使用>面积为4200平方英尺,仅剩下621只手。我意识到这可能还不够如果需要,我会寻找更多图像。但是,所有图像都注释如下:

enter image description here

我有如下边界框的坐标: enter image description here

然而,边界框未与x&对齐。 y轴。

我相信我必须将手从图像中裁剪出来。我有两种方法可以做到这一点:

1)让xmin和xmax为边界框的最小和最大x坐标。而ymin& ymax是最小值&边界框的最大y坐标。如果这样做,我会得到这个:

enter image description here(当然没有边界框) 基本上,背景的某些部分仍然在上面。

2)我可以使用二进制掩码“掩盖”边界框内的所有像素。如果我这样做,我的图像大小仍然是从xmin到xmax& ymin到ymax,但是我可以将背景的其余部分设置为白色。

什么会更好?我认为积极因素应该只包含感兴趣的对象(在这种情况下是手),所以留下背景可能不对吗?但是,白色背景可以吗?

这里的主要问题是边界框没有对齐!

2 个答案:

答案 0 :(得分:0)

留下少量背景是可以的,每张图片都会有所不同,因此不能作为分类器的一部分创建。

我建议制作一个更大的负片组来取消背景,620张图片就可以了。

答案 1 :(得分:0)

您可能还想查看labelme http://labelme.csail.mit.edu/Release3.0/index.php

我将它用于我的项目,他们还向您展示如何使用亚马逊土耳其人来获取您自己的数据集。我想你也可以使用他们的数据集。