来自spark-sklearn的GridSearchCV的best_score_参数不适用于版本0.2.3

时间:2018-05-16 13:29:46

标签: apache-spark scikit-learn pyspark grid-search

我希望使用GridSearchCV函数中的best_score_参数,但看起来在最新版本的库spark-sklearn(版本0.2.3)中不存在。当我尝试使用该命令卸载最新版本并重新安装旧版本(版本0.2.0)时 pip install spark-sklearn-0.2.0 这是行不通的。如何在我的群集环境中安装旧版本的spark-sklearn库? best_score_参数似乎在0.2.0版本中正常工作。 感谢

1 个答案:

答案 0 :(得分:3)

spark-sklearn版本0.2.3存在一个已知问题,因为gridSearchCV中没有best_score_参数。这个问题可以在这里找到 https://github.com/databricks/spark-sklearn/issues/73

要安装旧版本的库,请使用以下命令: pip install spark-sklearn == 0.2.0