如何使用libsvm计算多类预测的概率?

时间:2010-05-03 22:17:58

标签: java machine-learning probability svm libsvm

我正在使用libsvm,文档让我相信有一种方法可以输出输出分类准确性的可信概率。是这样吗?如果是这样,任何人都可以在代码中提供一个明确的示例吗?

目前,我正在以下列方式使用Java库

    SvmModel model = Svm.svm_train(problem, parameters);
    SvmNode x[] = getAnArrayOfSvmNodesForProblem();
    double predictedValue = Svm.svm_predict(model, x);

2 个答案:

答案 0 :(得分:7)

鉴于您的代码片段,我将假设您要使用与libSVM打包在一起的Java API,而不是jlibsvm提供的更冗长的Java API。

要使用概率估算启用预测,请使用 svm_parameter字段 probability 设置为1 来训练模型。然后,只需更改代码,使其调用 svm方法svm_predict_probability 而不是svm_predict

修改您的代码段,我们有:

parameters.probability = 1;
svm_model model = svm.svm_train(problem, parameters);

svm_node x[] = problem.x[0]; // let's try the first data pt in problem
double[] prob_estimates = new double[NUM_LABEL_CLASSES]; 
svm.svm_predict_probability(model, x, prob_estimates);

值得了解的是,多类概率估计的训练可以改变分类器做出的预测。有关详情,请参阅问题Calculating Nearest Match to Mean/Stddev Pair With LibSVM

答案 1 :(得分:1)

接受的答案就像一个魅力。确保在培训期间设置probability = 1

如果您在阈值未达到置信度时尝试删除预测,则代码示例如下:

double confidenceScores[] = new double[model.nr_class];
svm.svm_predict_probability(model, svmVector, confidenceScores);

/*System.out.println("text="+ text);
for (int i = 0; i < model.nr_class; i++) {
    System.out.println("i=" + i + ", labelNum:" + model.label[i] + ", name=" + classLoadMap.get(model.label[i]) + ", score="+confidenceScores[i]);
}*/

//finding max confidence; 
int maxConfidenceIndex = 0;
double maxConfidence = confidenceScores[maxConfidenceIndex];
for (int i = 1; i < confidenceScores.length; i++) {
    if(confidenceScores[i] > maxConfidence){
        maxConfidenceIndex = i;
        maxConfidence = confidenceScores[i];
    }
}

double threshold = 0.3; // set this based data & no. of classes
int labelNum = model.label[maxConfidenceIndex];
// reverse map number to name
String targetClassLabel = classLoadMap.get(labelNum); 
LOG.info("classNumber:{}, className:{}; confidence:{}; for text:{}",
        labelNum, targetClassLabel, (maxConfidence), text);
if (maxConfidence < threshold ) {
    LOG.info("Not enough confidence; threshold={}", threshold);
    targetClassLabel = null;
}
return targetClassLabel;