有条件的K折交叉验证

时间:2018-10-16 13:38:41

标签: python machine-learning scikit-learn classification cross-validation

我有一个分类器,将人的图像作为输入。

我使用10倍交叉验证来测试此分类器的准确性,如下所示:

cv = ShuffleSplit(n_splits=10, test_size=0.1, random_state=0)
scores = cross_val_score(clf, features, tags, cv=cv)

但是,我希望混洗/拆分不是那么随机,并且要考虑到一定的条件。

例如,假设我的数据集包含10,000张图片,但只有10个人。

因此,我希望将洗牌/分割的条件设为该人的ID,然后对数据进行划分,以使1个人的图像位于训练集或测试集上,而不是同时存在。

这样的东西存在吗?

0 个答案:

没有答案