标签: apache-spark apache-spark-mllib logistic-regression
我使用spark mllib运行二元逻辑回归。根据spark mllib的文档,RawPrediction是置信度值,我假设lcl和ucl的概率。我正在为RawPrediction获得-ve值。在什么情况下,原始预测值可以是-ve
答案 0 :(得分:3)
二元分类情况下的原始预测是相关类别的余量。对于特征向量X,
原始预测 z = WTX ∴ z ⊂ (-∞,+∞)
z = WTX
∴ z ⊂ (-∞,+∞)
预测概率= f(z) = 1 / ( 1 + e-z) f(z) ⊂ [0, 1]
f(z) = 1 / ( 1 + e-z)
f(z) ⊂ [0, 1]
原始预测计算的源代码:https://github.com/apache/spark/blob/master/mllib/src/main/scala/org/apache/spark/ml/classification/LogisticRegression.scala#L973