我有这些标签和功能,例如
labels features
[2.3] 1 5.1 7.2 5 5 5
[5.4] 4.5 3 2 4 6 4
[6.3] 3.3 1.3 5.4 6
像这样,我有超过1万个条目。如何使用Logistic回归在Spark中训练模型?
我知道我们可以使用线性回归。但是,我仍然想使用LogisticReg来检查其性能。
到目前为止,我所做的是将这些类映射到离散值,例如(2.3->0,5.4->1, 6.3->2)
我发现了11101个独特的标签。但是计算要花很多时间。
答案 0 :(得分:1)
这些标签似乎是连续变量(而不是离散变量)。据我所知,Spark中的逻辑回归只能用于分类,而不能用于回归(https://spark.apache.org/docs/2.2.0/ml-classification-regression.html)。