在训练我的模型时,当我使用sklearn.model_selection.train_test_split(X, y, stratify=y, train_size=0.9)
与sklearn.model_selection.StratifiedKFold(n_splits=10)
之类的内容时,我会得到截然不同的结果,并且想知道他们对数据进行分层的方式是否存在差异。我几乎可以肯定我根据文档实现了所有内容,但奇怪的是,后者的测试精度比第一次更差。
答案 0 :(得分:0)
当stratify
不是时,train_test_split
内部使用StratifiedShuffleSplit,而不是StratifiedKFold。所以,是的,有很大的不同。