我想知道sklearn.model_selection.RandomizedSearchCV
(在某种程度上GridSearchCV
)是如何处理模型,信息和内存的。
实际上,尽管进行了一些研究,但我找不到任何资源来解释(使用n_jobs =-1
或>1
)每个堆叠步骤中存储的内容。
尽管我非常确定每个模型都可以存储,因为您可以使用最佳参数来检索模型,但是它保留了每个参数吗?还是在每个步骤中都将最后一个与存储的那一个保持最佳状态?
预先感谢您的回复:)
答案 0 :(得分:0)
他们没有保留任何中间模型。仅存储与每个模型关联的超参数和输出度量。最终,具有最佳参数的模型将在整个数据上进行训练(未经交叉验证,因为那已经完成了)。
您可以查看我的其他答案,这些答案更详细地描述了GridSearchCV
:
RandomizedSearchCV
的功能相同,除了在第一部分中找到了候选参数组合。