根据python中的组在训练/测试/验证中拆分数据

时间:2019-04-05 14:51:28

标签: python machine-learning video scikit-learn train-test-split

我需要对视频数据进行分割,以使同一个人不能同时处于train_set和test_set中,然后不能同时处于train_set和validation_set中。

X:数据的numpy数组

y:目标的numpy数组

groups:numpy组数组(带有人名)

我可以轻松地对火车进行测试和测试,以便对我的部门进行存档:

kf = GroupKFold(n_splits=10) 
for train_index, test_index in kf.split(X, y,groups=groups):
        X_train, X_test = X[train_index], X[test_index]
        y_train, y_test = y[train_index], y[test_index]

然后,我需要对X_train进行划分,以使验证集与火车中的同一个人不共存。我只需要折叠即可,我的问题是我在第一次除法后就失去了索引,因此无法再次使用groups数组。

0 个答案:

没有答案