我有一个分类器,将人的图像作为输入。
我使用10倍交叉验证来测试此分类器的准确性,如下所示:
cv = ShuffleSplit(n_splits=10, test_size=0.1, random_state=0)
scores = cross_val_score(clf, features, tags, cv=cv)
但是,我希望混洗/拆分不是那么随机,并且要考虑到一定的条件。
例如,假设我的数据集包含10,000张图片,但只有10个人。
因此,我希望将洗牌/分割的条件设为该人的ID,然后对数据进行划分,以使1个人的图像位于训练集或测试集上,而不是同时存在。
这样的东西存在吗?