pyspark随机森林回归器预测多类

时间:2020-06-24 17:30:30

标签: machine-learning pyspark random-forest apache-spark-ml

我有randomforest回归pyspark ml模型。响应变量为9类。

当我预测测试数据时,我就有可能需要获取类。

使用的代码:

rf = RandomForestRegressor(featuresCol="scaled_features")
pipeline = Pipeline(stages=[featureIndexer, rf])

# Train model.  This also runs the indexer.
model = pipeline.fit(train)

# Make predictions.
predictions = model.transform(test)

evaluator = RegressionEvaluator(labelCol="label", predictionCol="prediction", metricName="rmse")
rmse = evaluator.evaluate(predictions)

1 个答案:

答案 0 :(得分:0)

您正在处理分类问题。因此,您应该使用RandomForestClassifier作为ML算法。

对于评估,您应该使用MulticlassClassificationEvaluator