无论如何要知道sklearn GridSearch的进展

时间:2016-05-22 14:30:13

标签: python machine-learning scikit-learn data-science

对于网格搜索总是很耗时,所以我想知道它现在运行了多少。例如,它可能会输出

paramsXXX processed
paramsYYY processed
...

2 个答案:

答案 0 :(得分:6)

为了取得进展,你可以增加例如sklearn.grid_search.GridSearchCV,添加参数verbose并为其提供一些正值

GridSearchCV(..., verbose=1)

来自文档

  

详细:整数

     

控制冗长:越高越好   消息。

答案 1 :(得分:1)

如果您想知道GridSearchCV将花费多少时间,您可以在运行GridSearchCV之前运行带有n_iter = 10的RandomizedSearchCV。假设使用n_iter = 10的RandomizedSearchCV需要10秒,使用100次迭代的GridSearchCV需要几乎100秒。这将使您更准确地了解GridSearchCV将花费多少时间。

甚至更好的是你可以使用n_iter = GridSearchCV迭代的一半来运行RandomizedSearchCV,以便在一半的时间内得到几乎相同的结果。