spark MLib中setLabelCol和setPredictionCol方法之间的区别

时间:2017-05-16 17:20:37

标签: machine-learning apache-spark-mllib

我使用逻辑回归进行spark Mlib中的分类,spark中的setLabelCol()和setPredictionCol()方法有什么区别?

1 个答案:

答案 0 :(得分:1)

它们是为标签和预测设置非默认列名的两种方法

  • setLabelCol(默认=“标签”)用于设置培训时间标签的列名称。例如。在训练二元分类器时,您需要一个包含1.0或0.0的“标签”。该算法将使用它来训练模型。
  • setPredicionCol(默认=“预测”)用于在评分时设置模型输出的列名。例如。上面训练的二进制分类器模型将向包含预测输出的DataFrame添加一个新列。

您可以使用explainParams查看可用的参数,默认值和简要文档。 E.G。

scala> new LogisticRegression().explainParams
res6: String = 
...
featuresCol: features column name (default: features)
...
labelCol: label column name (default: label)
...
predictionCol: prediction column name (default: prediction)
probabilityCol: Column name for predicted class conditional probabilities. 
...