使用Python API进行逻辑回归多类分类

时间:2016-08-09 19:51:19

标签: python classification logistic-regression

目前,Python API还不支持Spark中的多类分类,但将来会在Spark页面1中对其进行描述。

是否有任何发布日期或任何机会使用Python实现具有Logistic回归的多类?我知道它与Scala有关,但我想用Python运行它。谢谢。

1 个答案:

答案 0 :(得分:3)

scikit-learn的LogisticRegression提供multi_class参数。来自文档:

  

多类选项可以是'ovr'或'multinomial'。如果是选项   选择是'ovr',然后二元问题适合每个标签。否则   损失最小化是整个过程中的多项式损失   概率分布。仅适用于'lbfgs'求解器。

因此,multi_class='ovr'似乎是您的正确选择。

有关详细信息:see this link

添加了:

根据pyspark文档,您仍然可以使用其API进行多类回归。使用类pyspark.mllib.classification.LogisticRegressionWithLBFGS,您将获得用于多类分类的可选参数numClasses