Pyspark K折交叉验证平均RMSE

时间:2018-12-16 16:36:27

标签: machine-learning pyspark

我正在使用Pyspark对数据集进行k折交叉验证的线性回归。目前,我只能确定最佳模型的均方根误差。但是我想要在交叉验证中评估的所有模型的平均RMSE。如何在交叉验证中获得所有评估模型的平均RMSE?

PokemonData

1 个答案:

答案 0 :(得分:0)

只需从交叉验证器中提取其他模型

Spark CrossValidatorModel access other models than the bestModel?

然后分别使用RegressionEvaluator并手动计算平均值。