当我发现"修复"时,我试图在Sklearn中对分组数据进行交叉验证。方法
适合(X,y =无,组=无,** fit_params)
将groups参数定义为:
groups:类似于array,带有shape(n_samples,),可选 将数据集拆分为训练/测试集时使用的样本的组标签。
这与将数据与其他分组数据(UIView
,GroupKFold
)的迭代器分开是一回事吗?
如果没有,使用分组数据运行GridSeachCV的正确方法是什么?
答案 0 :(得分:0)
是的,它们是一样的。
请参阅GridsearchCV fit()
的文档:
组:类似于数组,带有形状(n_samples,),可选
Group labels for the samples used while splitting the dataset into train/test set.