OpenCV SVM训练数据集

时间:2015-05-31 15:17:57

标签: opencv dataset computer-vision svm training-data

假设我有大约350张正面图像和400多张负面图像的数据集。它们的大小不同。它们的尺寸也大于640x320。

  1. 我该怎么做才能创建更好的数据集?我需要更小的图像吗?如果是,为什么?

  2. 我应该对数据集应用一些规范化吗?应该是什么(对比,降噪)?

  3. 我可以使用现有的数据集创建更大的数据集吗?如果是,怎么做?

  4. 提前致谢!

2 个答案:

答案 0 :(得分:2)

  1. 图像的最佳尺寸是您可以轻松地对对象进行分类 自己。
  2. 是的,分类器在规范化后效果更好,有 选项。最常用的方法是中心数据集(减去均值)和归一化范围 值在[-1:1]范围内说。其他流行的标准化方法与之前类似,但标准化标准偏差(在大多数情况下最好)。
  3. 是的,您可以通过添加来创建更大的数据集 来自现有数据集的图像的扭曲和噪音。

答案 1 :(得分:2)

查看INRIA数据集以及他们如何“标准化”他们的输入图像以进行HoG人员检测培训的评论。

http://pascal.inrialpes.fr/data/human/

尚未提及的一件事是,对于大多数检测技术而言,仅在该图像内收集具有期望对象“某处”的一组n个图像是不够的。相反,你应该在对象周围裁剪图像(带有一些边框)。

e.g。对于人物检测,他们使用此输入图像:

enter image description here

但他们裁剪并重新调整(并转换)了这些区域(对象):

enter image description here enter image description here enter image description here enter image description here enter image description here enter image description here enter image description here enter image description here

也可能在论文中有一些关于培训的好提示: http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf