过度拟合如何导致对象检测中出现误报?

时间:2019-12-02 05:38:03

标签: machine-learning deep-learning computer-vision false-positive

我正在进行张量流object detection,发现有很多false positives。我看到的主要原因之一是overfitting的情况。但是我怀疑false positive如何成为overfitting的结果?当它学习到数据中的复杂模式时,就会发生过度拟合,或者简而言之,它会导致数据记忆化。

如果这是一种回忆,它不会显示更多的假阴性,因为它只有memorised the training data并且无法检测到新的案件。如何将其他对象真正归为受过训练的课程is it not counter intuitive?

1 个答案:

答案 0 :(得分:2)

我想到的一个原因是您的训练数据中的异常值

假设您在A类的训练数据中有一些异常值,结果可能在某个维度上更多地位于其他B类的域中,那么过度拟合将导致类边界朝着这个离群值。这可能有效地导致很多误报,因为A类的偏移边界现在部分位于应该在B类范围内的区域。

举一个极端的例子,过度拟合的边界可能看起来像这样:

enter image description here

在这里,由于过度拟合,我们将异常值保留在正类别中,但同时也要考虑两个假负。这两个类别之间的广义良好边界会将异常值视为假阴性,但由于不同时包括这两个假阳性,因此仍具有较高的准确性。

顺便说一句,由于异常值,相同的结果可能会导致误报,这就是为什么过度拟合通常被认为是不好的原因。