如果我在完成之前中断grid_search.fit(),我会放弃它到目前为止所做的一切吗? 我的网格搜索带走了一点点,并提供了一个极其庞大的搜索空间。我可以看到我已经满意的分数,但我的标准并没有显示哪些参数导致这些分数......
我搜索了文档:http://scikit-learn.org/stable/modules/generated/sklearn.grid_search.GridSearchCV.html
几年前有一个关于在这里添加并行搜索功能的讨论:https://sourceforge.net/p/scikit-learn/mailman/message/31036457/
但没有确定的。我的搜索已经工作了大约48小时,所以我不想放松已发现的东西,但我也不想继续。
谢谢!
答案 0 :(得分:2)
欢迎来到SO!
根据我的理解,没有任何从grid_search函数返回的中间变量,只有结果网格及其分数(有关详细信息,请参见此处grid search.py)。
因此,如果您取消它,您可能会失去迄今为止所做的工作。
但是有点建议,48小时很长一段时间(显然这取决于调整的超级参数的行数,列数和数量)。 您可能希望先从更广泛的网格搜索开始,然后从中优化参数搜索。
这将有两个方面让你受益:
运行时间可能会缩短得多(请参阅上面的警告),这意味着您不必等待这么长时间并冒着失去结果的风险
您可能会发现您的模型预测分数仅受一个或两个超级参数的影响,让您可以更广泛地保持其他搜索,并将您的工作集中在最能影响预测准确性的参数上。
希望当我写完这个回复时,您的网格搜索已经完成!!