我正在做逻辑回归项目。在这样做的同时,我遇到了以上概念。那么什么是randomsearchCV和gridsearchCV?
答案 0 :(得分:0)
我假设您是说sklearn中使用的交叉验证(CV)策略类别。
交叉验证是一种评估模型的方法。一个众所周知的用例是评估模型中要使用哪些超参数集,例如梯度下降中的学习率。
要找到最佳超参数,我们采用一组候选超参数,为所有这些参数训练模型,并通过交叉验证比较其适用性。最后,我们选择给出最佳简历得分的超参数。
文档位于:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.RandomizedSearchCV.html
简而言之,这使用了一组随机的超参数。当有许多超参数时很有用,因此搜索空间很大。如果您事先对超参数应该有什么看法,可以使用。
文档位于:https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html
在搜索空间上创建一个网格,并为该空间中所有可能的超参数评估模型。从简单和详尽的意义上讲,这是好的。不利的一面是,如果搜索空间很大(例如,很多超参数),那么在计算时间上的开销可能会过高。