spark_sklearn GridSearchCV __init__因参数错误而失败

时间:2017-12-08 23:22:42

标签: python apache-spark machine-learning scikit-learn

我正在尝试使用spark_sklearn.GridSearchCV,但是 init 参数错误。

TypeError: __init__() takes at least 4 arguments (4 given)

这是代码:

from spark_sklearn import GridSearchCV

gsearch2 = GridSearchCV(estimator=ensemble.GradientBoostingRegressor(**params), param_grid=param_test2, n_jobs=1)

如果我向GridSearchCV提供更多参数,例如添加cv=5,则错误将变为

TypeError: __init__() takes at least 4 arguments (5 given)

有什么建议吗?

感谢。

1 个答案:

答案 0 :(得分:2)

GridSearchCV.__init__需要3 obligatory arguments

  • sc - SparkContext
  • estimator
  • param_grid

您忘记了SparkContext

GridSearchCV(
    sc=SparkContext.getOrCreate(),
    estimator=ensemble.GradientBoostingRegressor(**params), 
    param_grid=param_test2, n_jobs=1)