目前,Python API还不支持Spark中的多类分类,但将来会在Spark页面1中对其进行描述。
是否有任何发布日期或任何机会使用Python实现具有Logistic回归的多类?我知道它与Scala有关,但我想用Python运行它。谢谢。
答案 0 :(得分:3)
scikit-learn的LogisticRegression提供multi_class
参数。来自文档:
多类选项可以是'ovr'或'multinomial'。如果是选项 选择是'ovr',然后二元问题适合每个标签。否则 损失最小化是整个过程中的多项式损失 概率分布。仅适用于'lbfgs'求解器。
因此,multi_class='ovr'
似乎是您的正确选择。
有关详细信息:see this link
添加了:
根据pyspark文档,您仍然可以使用其API进行多类回归。使用类pyspark.mllib.classification.LogisticRegressionWithLBFGS
,您将获得用于多类分类的可选参数numClasses
。