我正在训练级联分类器,以便检测图像中的动物。不幸的是,我的假阳性率非常高(使用Haar和LBP超高,使用HOG可接受)。我想知道如何改进我的分类器。
以下是我的问题:
- 强健检测所需的训练样本量是多少?我读过某个地方需要4000个pos和800个neg样本。这是一个很好的估计吗?
- 训练样本应该有多么不同?有没有办法量化图像差异,以包含/排除可能的“重复”数据?
- 我该如何处理被遮挡的物体?我应该只训练可见的动物部分,还是应该选择我的投资回报率以使平均投资回报率保持不变?
- 重新闭塞的物体:动物有腿,胳膊,尾巴,头等。由于一些身体部位往往被遮挡,选择'躯干'作为投资回报率是否有意义?
- 我应该尝试缩小图像尺寸并训练较小的图像尺寸吗?这可能会改善一些事情吗?
我愿意接受任何指示!