假设我有大约350张正面图像和400多张负面图像的数据集。它们的大小不同。它们的尺寸也大于640x320。
我该怎么做才能创建更好的数据集?我需要更小的图像吗?如果是,为什么?
我应该对数据集应用一些规范化吗?应该是什么(对比,降噪)?
我可以使用现有的数据集创建更大的数据集吗?如果是,怎么做?
提前致谢!
答案 0 :(得分:2)
答案 1 :(得分:2)
查看INRIA数据集以及他们如何“标准化”他们的输入图像以进行HoG人员检测培训的评论。
http://pascal.inrialpes.fr/data/human/
尚未提及的一件事是,对于大多数检测技术而言,仅在该图像内收集具有期望对象“某处”的一组n个图像是不够的。相反,你应该在对象周围裁剪图像(带有一些边框)。
e.g。对于人物检测,他们使用此输入图像:
但他们裁剪并重新调整(并转换)了这些区域(对象):
也可能在论文中有一些关于培训的好提示: http://lear.inrialpes.fr/people/dalal/NavneetDalalThesis.pdf