Question

当我发现＆＃34;修复＆＃34;时，我试图在Sklearn中对分组数据进行交叉验证。方法

适合（X，y =无，组=无，** fit_params）

将groups参数定义为：

groups：类似于array，带有shape（n_samples，），可选将数据集拆分为训练/测试集时使用的样本的组标签。

这与将数据与其他分组数据（UIView，GroupKFold）的迭代器分开是一回事吗？如果没有，使用分组数据运行GridSeachCV的正确方法是什么？

Answer 1

是的，它们是一样的。

请参阅GridsearchCV fit()的文档：

组：类似于数组，带有形状（n_samples，），可选
Group labels for the samples used while splitting the dataset into train/test set.