我的代码如下:
from pyspark.ml.classification import LogisticRegression
lr = LogisticRegression(featuresCol="features", labelCol="label")
lrm = lr.fit(transformed)
predictions = lrm.transform(transformed)
predictions.select('probability')
这给了我2个概率,因为我有2个班级。 但我不知道哪个概率属于哪个班级。怎么找到。感谢
答案 0 :(得分:0)
spark预测基于p> 0.5的类。因此,从预测数据帧中选择概率和预测列。检查数据帧的第一行,并查看哪个元素的值大于0.5并查看预测类。因此,例如,元素1的值为0.56,预测为2级。则概率的第0个元素属于第1类概率,第1个元素为第2类。