Question

我有这些标签和功能，例如

labels features
 [2.3]   1 5.1 7.2 5 5 5
 [5.4]   4.5 3 2 4 6 4
 [6.3]   3.3 1.3 5.4 6

像这样，我有超过1万个条目。如何使用Logistic回归在Spark中训练模型？我知道我们可以使用线性回归。但是，我仍然想使用LogisticReg来检查其性能。到目前为止，我所做的是将这些类映射到离散值，例如(2.3->0,5.4->1, 6.3->2) 我发现了11101个独特的标签。但是计算要花很多时间。

Answer 1

这些标签似乎是连续变量（而不是离散变量）。据我所知，Spark中的逻辑回归只能用于分类，而不能用于回归（https://spark.apache.org/docs/2.2.0/ml-classification-regression.html）。

数值数据的Logistic回归

1 个答案: