我正在研究图像中的边缘检测,并且想评估算法的性能,如果任何人可以给我一个关于如何进行它的参考或方法将是非常有帮助的。 :)
我没有基本事实,数据集包括颜色和灰色图像。
谢谢。
答案 0 :(得分:2)
创建具有已知边缘的合成数据集,例如通过3D渲染,通过合成具有精确蒙版的2D图像(可以在免版税照片中获得),或通过直接引入边缘(细/微线) 。请记住添加一些看起来像边缘的混杂非边缘,其类型适合您正在调整的类型。
使用您的(非合成)数据集。运行要与之比较的参考算法。还产生参考算法的组合,例如通过投票(多数,至少K中的N等)。根据(a)您的算法分类为每个参考算法的边缘的点数,或者组合不归类为边缘(误报),或(b)点数,计算您的算法与参考算法性能的统计数据参考算法分类为你的算法没有的边缘(假阴性)。您还可以通过查看每个点并查看哪些算法将(或不)将其归类为边缘来计算算法的等级相关类型编号。
手动创建地面实况。使用参考边缘搜索算法作为起点,然后手动修复。在任何情况下,对于少量图像都可能有价值。
答案 1 :(得分:1)
对于比较,像@Alex我解释的定量测量最好。要做到这一点,您需要使用基础事实集来定义什么是“正确的”,并且需要一种方法来一致地确定给定图像是否正确或更细粒度,如何正确(某些数字如百分比)。 @Alex我给了一个方法来做到这一点。
在没有基本事实的图形研究中经常使用的另一种选择是用户研究。通常不太理想,因为它们耗时并且通常更昂贵。但是,如果您正在进行定性改进,或者如果定量测量难以做到,那么用户研究就是一个合适的解决方案。
当我指的是用户学习时,我的意思是向人们推荐输入图像的结果。您可以给它们一个比例来评估事物,然后从结果和另一个算法的结果中随机给出样本
当然,如果你还想要更多的想法,一定要查看边缘检测文件,看看他们如何衡量他们的结果(我实际上是先看看这里,因为他们已经经历了同样的过程并确定了什么对他们来说是最好的:google scholar)。