我已经创建了多个haar级联的脸部分类器。我每次都使用不同数量的正面和负面。
例如,
第一个分类器: 5000正面和3000负面
第二个分类器: 3000个正面和3000个负面(删除了2000个冗余/类似图像)
这两个分类器的效率几乎相同......
问题:
在培训之前,我是否有可以删除数据库中所有冗余图像的方法?
训练分类器的理想照明和背景条件是什么?
数据库中有多少图像被认为是获得最佳性能的理想选择,还是取决于集合中的数据类型?
此致
...萨利赫
答案 0 :(得分:1)
最适合您的工作。
<强>数目:强>
我想知道在训练第二个分类器时如何删除冗余图像。我不能告诉你确切的解决方案。一种解决方案可能是:采用简单的haar功能,获取两个图像的特征向量(比如F1和F2)。如果F1和F2之间的相关性为零(或小于某个阈值),则图像类似。你必须测试这个。如果有效,请告诉我。
这取决于应用程序。如果想要在具有不断变化的照明和背景的场景中使用分类器,那么这些图像应该包含在训练分类器中。
培训数据库应包含许多图像(通常为数千张图像)。重要的是图像在外观,幻觉,阴影等方面的变化。数据库的变化使分类器更加健壮。