在pyspark LogisticRegression输出中,whick概率属于哪个类?

时间:2017-06-13 17:07:22

标签: apache-spark pyspark logistic-regression

我的代码如下:

from pyspark.ml.classification import LogisticRegression
lr = LogisticRegression(featuresCol="features", labelCol="label")
lrm = lr.fit(transformed)
predictions = lrm.transform(transformed)
predictions.select('probability')

这给了我2个概率,因为我有2个班级。 但我不知道哪个概率属于哪个班级。怎么找到。感谢

1 个答案:

答案 0 :(得分:0)

spark预测基于p> 0.5的类。因此,从预测数据帧中选择概率和预测列。检查数据帧的第一行,并查看哪个元素的值大于0.5并查看预测类。因此,例如,元素1的值为0.56,预测为2级。则概率的第0个元素属于第1类概率,第1个元素为第2类。