我使用逻辑回归进行spark Mlib中的分类,spark中的setLabelCol(
)和setPredictionCol()
方法有什么区别?
答案 0 :(得分:1)
它们是为标签和预测设置非默认列名的两种方法
setLabelCol
(默认=“标签”)用于设置培训时间标签的列名称。例如。在训练二元分类器时,您需要一个包含1.0或0.0的“标签”。该算法将使用它来训练模型。setPredicionCol
(默认=“预测”)用于在评分时设置模型输出的列名。例如。上面训练的二进制分类器模型将向包含预测输出的DataFrame添加一个新列。您可以使用explainParams
查看可用的参数,默认值和简要文档。 E.G。
scala> new LogisticRegression().explainParams
res6: String =
...
featuresCol: features column name (default: features)
...
labelCol: label column name (default: label)
...
predictionCol: prediction column name (default: prediction)
probabilityCol: Column name for predicted class conditional probabilities.
...