我不了解Spark MLLib算法中SVM分类器的输出。我想将得分转换为概率,这样我就得到了属于某个类的数据点的概率(SVM在其上训练,a.k.a。多类问题)(see also this thread)。目前还不清楚得分意味着什么。它是超平面的距离吗?我如何从中获得概率?
答案 0 :(得分:2)
Fraction(1, 20)
如果您在MLLib中使用SVM模块,它们会为您提供AUC,即ROC曲线下的面积,它相当于" Accuracy" 。希望它有所帮助。
答案 1 :(得分:1)
值是边距 - 分离超平面的距离。它不是一个概率,而SVM通常不会给你一个概率。但是,正如@cfh注释的那样,您可以尝试根据此边距学习概率。但这与SVM分开。