我完成了研究,然后意识到出了点问题。
我很震惊地意识到我的训练集包括测试集!!!!!
这是我的代码
indices = np.arange(seq.shape[0])
print(len(indices))#Output: The length of the dataset #1128
indices_train,indices_test,labels_train,labels_test = train_test_split(indices,labels, test_size=0.1, stratify=labels,random_state=10)
redundant=[x for x in indices_test if x in indices_train]
print(len(redundant))#Output 71
请帮助我。我的错是什么:(