Spark - 预测概率API(predict_proba)

时间:2014-10-28 02:07:37

标签: apache-spark

Apache Spark是否提供API来获得与scikit-learn的predict_proba函数类似的决策树的预测概率(即decision_tree.predict_proba(X))?

1 个答案:

答案 0 :(得分:1)

我自己在寻找这个。当我注意到api具有非常笨拙的功能时(至少对于LogisticRegressionModel),我几乎已经破解了一个解决方案:

您清除阈值(使用clearThreshold())。这样,预测函数不会返回标签,而是返回基础值。

Java docs这样说:

  

public LogisticRegressionModel clearThreshold()   :: Experimental ::清除阈值,以便预测输出原始预测分数。

仅供参考:返回值介于0和1之间,默认阈值为.5,因此您可以轻松评估要设置阈值的内容。