我有randomforest回归pyspark ml模型。响应变量为9类。
当我预测测试数据时,我就有可能需要获取类。
使用的代码:
rf = RandomForestRegressor(featuresCol="scaled_features")
pipeline = Pipeline(stages=[featureIndexer, rf])
# Train model. This also runs the indexer.
model = pipeline.fit(train)
# Make predictions.
predictions = model.transform(test)
evaluator = RegressionEvaluator(labelCol="label", predictionCol="prediction", metricName="rmse")
rmse = evaluator.evaluate(predictions)
答案 0 :(得分:0)
您正在处理分类问题。因此,您应该使用RandomForestClassifier
作为ML算法。
对于评估,您应该使用MulticlassClassificationEvaluator
。