如何获得机器学习成绩的分数?

时间:2015-12-06 18:52:27

标签: machine-learning

我是机器学习的新手,我目前正致力于分类问题。我能够训练模型并预测测试数据集。我想知道是否有某种方式可以获得与预测相符的分数。按分数,我的意思是那些接近分数和预测。例如,在标准年龄 - 工资购买(基于年龄和工资,无论客户是否会购买产品)分类问题,我想知道他将购买该产品的100分中的分数是什么预测他是否会购买。

目前,我正在使用LibSVM Algo。是否有一些算法为我提供了以上数据?

感谢。

1 个答案:

答案 0 :(得分:0)

您正在寻找的是支持您的决定。换句话说,许多分类器将x类的决定建立在标签Y之上:

cl(x) = arg max_{y \in Y} p(y|x)

其中p(y|x)是“x具有标签y”的内部估计。这样的分类器包括:

  • 神经网络(带有sigmoid输出)
  • 逻辑回归
  • 天真的贝叶斯
  • 投票合奏(如RF)
  • ...

这些方法可以很容易地转换为0-100比例,因为概率是0-1比例。

另一方面,有些人使用与概率成比例的度量(例如SVM),但是无界限,这里你可以得到这个值(通常称为决策函数),但是你不能将它转换为0-100分(因为你没有有“最大”的价值)。这是一个很大的缺点,因此提出了一些修改。特别是对于SVM,您有Platt的缩放,它实际上适合SVM之上的逻辑回归,因此您可以获得概率估计。在libSVM中,您可以设置-b以获得概率估算值

来自libsvm website

  

-b probability_estimates:是否训练SVC或SVR模型进行概率估计,0或1(默认为0)