使用对数标度对分类器得分进行归一化以进行比较

时间:2015-01-13 16:26:43

标签: python machine-learning computer-vision classification logarithm

比较不同分类器的得分结果有什么好方法?

例如,假设我有一个分类器来处理12种不同类别的水果。 在这12个班级中,其中4个代表苹果的不同视图,4个代表香蕉的视图,4个代表菠萝。这是一个多类分类器,给定一个图像,它为图像可能属于的所有可能的12个水果类分配一个分数。得分最高的班级被选为图像的THE类。

现在除此之外 - 我有3个单独的分类器,一个用于苹果,一个用于香蕉,一个用于菠萝。每个分类器处理4种不同的水果视图。

我想比较使用单个12级分类器是否比使用单个4级分类器的组合提供更好的结果。

当我在苹果图像上运行12级分类器时,结果确实不如运行单个苹果分类器的结果准确,香蕉和菠萝也是如此。

我现在要做的是构建3个分类器的组合。所以我的程序将在一个图像上运行所有3个分类器,并告诉我最可能的类是什么。

问题是 - 我如何规范不同分类器的分数,以便我可以在3个分类器的类之间进行比较,并选择得分最高的类?虽然用于训练个体分类器的方法是相同的,但我怀疑我可以在没有某种规范化的情况下直接比较他们的分数。

将所有分数转换为对数刻度然后进行比较是否可行?

1 个答案:

答案 0 :(得分:1)

规范化分类器的常用方法是通过在libSVM中实现的Platt-Scaling完成的。它是一个直接的标准化,如下面的链接所述。

http://en.wikipedia.org/wiki/Platt_scaling