Question

Framework: Caffe
Architecture: Mobilenet-SSD
Dataset: [Caltech Padestrain Detection Dataset][1]

我知道精度，召回率，F1得分和准确性的公式。我知道公式，但是这里的问题是自动化的问题

我可以手动计算所有内容，但是问题在于自动化测试数据集中约1万张图像

因为我可以看到一张图片并比较误报等原因，但是不确定如何使用计算机

因为我的模型可能检测到一个人，但是边界框稍大（坐标不正确）并且测试数据集标签准确

因此，尽管正在检测但坐标不匹配。

如何解决此问题以计算精度，召回率和准确性？如果这不是正确的方法，请提出正确的方法

Answer 1

嗯，好问题。我认为您应该定义要实际测量的内容。 F1得分，准确性和召回率都很容易。只需查看是否已检测到某个人，或者您有误报，然后像往常一样计算事物即可。为此，请使用scikit。

现在介绍边界框，区域和坐标。您应该使用其他指标！我建议您使用mAP（平均平均精度）。查看此link，并随时在互联网上阅读有关此内容的更多信息。祝您的模特好运！

另一种选择是使用以下要点confusionMatrix_convnet_test_BatchMode(VeryFast).py来使用sklearn构建混淆矩阵。