在用于人体检测的定向梯度直方图(Navneet Dalal和Bill Triggs)(见下面的链接)中,为了可视化它们的结果,它们使用ROC曲线,其中Y轴是TP和X轴 FPPW(每个窗口误报)。
这句话FFPW
的含义是什么?
我想到了3种可能的选择......我不知道 - 也许所有这些都是错的。我们将非常感谢您的帮助:
也许这是错误分类的阴性样本的比率,即:(NUMBER_OF_FALSE_POSITIVES / NUMBER_OF_NEGATIVE_SAMPLES)
或许这是每个真实警报的误报率,即:(NUMBER_OF_FALSE_POSITIVES / NUMBER_OF_TRUE_POSITIVES)
或者也许是whle图像中每个真实窗口的误报率,
这是:(NUMBER_OF_FALSE_POSITIVES / NUMBER_OF_TRUE_SAMPLES)
我很高兴知道其中一个是否正确,或者你是否知道其他正确的定义。
链接到论文: (https://lear.inrialpes.fr/people/triggs/pubs/Dalal-cvpr05.pdf)
答案 0 :(得分:4)
它似乎被定义为NUMBER_OF_FALSE_POSITIVES / NUMBER_OF_WINDOWS
,其中检测窗口是64x128
移动窗口。请注意在第4节的最后一段中说明:
... In a multiscale detector it corresponds to a raw error rate of about 0.8 false positives per 640×480 image tested.
答案 1 :(得分:3)
我也有同样的困惑。作者声明他们正在使用 DET曲线。当您查看有关DET曲线的多个examples时,您会发现x轴实际上是假阳性率。这意味着FPPW
为FALSE_POSITIVE_RATE
。
因此FPPW = NUMBER_OF_FALSE_POSITIVES / NUMBER_OF_NEGATIVE_SAMPLES
答案 2 :(得分:0)
他们有一个窗口,他们在图像中移动并评估它是否显示人类。 FPPW衡量他们在探测器窗口内检测其他东西的频率。它以独立于图像大小或特定图像上的人数的方式描述其分类的质量。
所以基本上他们会计算他们的愚蠢的计算机多久会说“是的,这是一个人”,当他们向它展示一些摇滚或冰淇淋时。