我是机器学习的新手,我目前正致力于分类问题。我能够训练模型并预测测试数据集。我想知道是否有某种方式可以获得与预测相符的分数。按分数,我的意思是那些接近分数和预测。例如,在标准年龄 - 工资购买(基于年龄和工资,无论客户是否会购买产品)分类问题,我想知道他将购买该产品的100分中的分数是什么预测他是否会购买。
目前,我正在使用LibSVM Algo。是否有一些算法为我提供了以上数据?
感谢。
答案 0 :(得分:0)
您正在寻找的是支持您的决定。换句话说,许多分类器将x
类的决定建立在标签Y
之上:
cl(x) = arg max_{y \in Y} p(y|x)
其中p(y|x)
是“x具有标签y”的内部估计。这样的分类器包括:
这些方法可以很容易地转换为0-100比例,因为概率是0-1比例。
另一方面,有些人使用与概率成比例的度量(例如SVM),但是无界限,这里你可以得到这个值(通常称为决策函数),但是你不能将它转换为0-100分(因为你没有有“最大”的价值)。这是一个很大的缺点,因此提出了一些修改。特别是对于SVM,您有Platt的缩放,它实际上适合SVM之上的逻辑回归,因此您可以获得概率估计。在libSVM
中,您可以设置-b
以获得概率估算值
-b probability_estimates:是否训练SVC或SVR模型进行概率估计,0或1(默认为0)