通过train_test_split(),我的训练集包括测试集

时间:2018-12-06 04:33:20

标签: testing scikit-learn training-data

我完成了研究,然后意识到出了点问题。

我很震惊地意识到我的训练集包括测试集!!!!!

这是我的代码

indices = np.arange(seq.shape[0])
print(len(indices))#Output: The length of the dataset #1128

indices_train,indices_test,labels_train,labels_test = train_test_split(indices,labels, test_size=0.1, stratify=labels,random_state=10)

redundant=[x for x in indices_test if x in indices_train]

print(len(redundant))#Output 71

请帮助我。我的错是什么:(

0 个答案:

没有答案