StratifiedKFold与train_test_split的分层之间的差异

时间:2017-06-14 23:20:50

标签: scikit-learn

在训练我的模型时,当我使用sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)sklearn.model_selection.StratifiedKFold(n_splits=10)之类的内容时,我会得到截然不同的结果,并且想知道他们对数据进行分层的方式是否存在差异。我几乎可以肯定我根据文档实现了所有内容,但奇怪的是,后者的测试精度比第一次更差。

1 个答案:

答案 0 :(得分:0)

stratify不是时,train_test_split内部使用StratifiedShuffleSplit,而不是StratifiedKFold。所以,是的,有很大的不同。