我有一些视频被认为是人们发现的基本事实:this is an example。
我也有主视频(没有任何检测),我必须在上面运行人员检测算法,并将我的结果与地面真实视频进行比较。
问题是我不仅要进行定性比较,还要进行定量。因此,就我能够计算个人算法中的检测次数而言,我必须找到一种可靠的方法来计算每一帧地面真实视频中出现的边界框的数量。
我已经考虑了this link和this one either,但是它们的作用是找到形状的轮廓,而不是边界框。我知道检测检测次数听起来似乎毫无意义,但这是我必须获得数字基础事实的唯一方法。
答案 0 :(得分:1)
使用具有源视频和地面事实的pedestrian dataset。源视频将是一个视频文件(例如.avi),基本事实是电子表格(例如.csv)。电子表格中保存了行人周围的x,y坐标以及边框的宽度和高度。
要以视觉方式检查您的结果,请在同一视频上绘制基本事实和结果。
使用算法定量检查结果。我使用的精度函数是:
overlap / ((ground_truth_area + my_results_area)/2)
重叠部分在gif中以灰色显示。 How I calculated overlap.