Apache Spark是否提供API来获得与scikit-learn的predict_proba函数类似的决策树的预测概率(即decision_tree.predict_proba(X))?
答案 0 :(得分:1)
我自己在寻找这个。当我注意到api具有非常笨拙的功能时(至少对于LogisticRegressionModel
),我几乎已经破解了一个解决方案:
您清除阈值(使用clearThreshold()
)。这样,预测函数不会返回标签,而是返回基础值。
Java docs这样说:
public LogisticRegressionModel clearThreshold() :: Experimental ::清除阈值,以便预测输出原始预测分数。
仅供参考:返回值介于0和1之间,默认阈值为.5,因此您可以轻松评估要设置阈值的内容。