什么是火花mllib中Logistic回归的原始预测?

时间:2017-04-30 18:32:30

标签: apache-spark apache-spark-mllib logistic-regression

我使用spark mllib运行二元逻辑回归。根据spark mllib的文档,RawPrediction是置信度值,我假设lcl和ucl的概率。我正在为RawPrediction获得-ve值。在什么情况下,原始预测值可以是-ve

1 个答案:

答案 0 :(得分:3)

二元分类情况下的原始预测是相关类别的余量。对于特征向量X,

原始预测 z = WTX
∴ z ⊂ (-∞,+∞)

预测概率=
f(z) = 1 / ( 1 + e-z)
f(z) ⊂ [0, 1]

原始预测计算的源代码:https://github.com/apache/spark/blob/master/mllib/src/main/scala/org/apache/spark/ml/classification/LogisticRegression.scala#L973