我正在尝试使用cross_val_score
进行密集测试,以获取解决方案的整体准确性。
from sklearn.model_selection import cross_val_score
clf = svm.SVC(kernel='linear', C=1)
scores = cross_val_score(clf, X, y, cv=5)
但是我的情况与普通X和y有所不同。我正在使用数据汇总为训练部分生成更多数据,即每个样本将具有30个新生成的数据。换句话说,x1将具有30个样本,x2将具有30个样本,因此现在如果我传递真实数据+增强数据,则交叉验证将变得无用,因为增强数据仅用于训练部分而并非测试零件,因为我只需要使用真实数据进行测试。有没有办法可以解决这个问题?我希望我能传达这个问题