Framework: Caffe
Architecture: Mobilenet-SSD
Dataset: [Caltech Padestrain Detection Dataset][1]
我知道精度,召回率,F1得分和准确性的公式。我知道公式,但是这里的问题是自动化的问题
我可以手动计算所有内容,但是问题在于自动化测试数据集中约1万张图像
因为我可以看到一张图片并比较误报等原因,但是不确定如何使用计算机
因为我的模型可能检测到一个人,但是边界框稍大(坐标不正确)并且测试数据集标签准确
因此,尽管正在检测但坐标不匹配。
如何解决此问题以计算精度,召回率和准确性?如果这不是正确的方法,请提出正确的方法
答案 0 :(得分:1)
嗯,好问题。我认为您应该定义要实际测量的内容。 F1得分,准确性和召回率都很容易。只需查看是否已检测到某个人,或者您有误报,然后像往常一样计算事物即可。为此,请使用scikit。
现在介绍边界框,区域和坐标。您应该使用其他指标!我建议您使用mAP(平均平均精度)。查看此link,并随时在互联网上阅读有关此内容的更多信息。祝您的模特好运!
另一种选择是使用以下要点confusionMatrix_convnet_test_BatchMode(VeryFast).py来使用sklearn构建混淆矩阵。