数值数据的Logistic回归

时间:2018-09-26 15:37:02

标签: apache-spark apache-spark-mllib logistic-regression apache-spark-ml

我有这些标签和功能,例如

labels features
 [2.3]   1 5.1 7.2 5 5 5
 [5.4]   4.5 3 2 4 6 4
 [6.3]   3.3 1.3 5.4 6

像这样,我有超过1万个条目。如何使用Logistic回归在Spark中训练模型? 我知道我们可以使用线性回归。但是,我仍然想使用LogisticReg来检查其性能。 到目前为止,我所做的是将这些类映射到离散值,例如(2.3->0,5.4->1, 6.3->2) 我发现了11101个独特的标签。但是计算要花很多时间。

1 个答案:

答案 0 :(得分:1)

这些标签似乎是连续变量(而不是离散变量)。据我所知,Spark中的逻辑回归只能用于分类,而不能用于回归(https://spark.apache.org/docs/2.2.0/ml-classification-regression.html)。