我正在使用Pyspark对数据集进行k折交叉验证的线性回归。目前,我只能确定最佳模型的均方根误差。但是我想要在交叉验证中评估的所有模型的平均RMSE。如何在交叉验证中获得所有评估模型的平均RMSE?
PokemonData
答案 0 :(得分:0)
只需从交叉验证器中提取其他模型
Spark CrossValidatorModel access other models than the bestModel?
然后分别使用RegressionEvaluator并手动计算平均值。