StratifiedShuffleSplit(在sklearn中)每次返回不同的比例

时间:2017-05-18 06:04:08

标签: scikit-learn

我在sklearn中使用stratifiedShuffleSplit将训练数据分成批次。因此,我输入NN的每个批次将与训练集具有相同的等级比例。或者换句话说,我希望为每个批次保留与训练集相同的百分比。

我感到困惑的是,对于每次迭代,每批次都有一点点差异。它没有遵循训练集的确切百分比,尽管它有类似的趋势。为什么stratifiedShuffleSplit没有给出确切的百分比?

所以现在,我只是自己编写代码以获得完全相同的百分比。

1 个答案:

答案 0 :(得分:1)

想象一下,你有11分并想要70%的训练集。你会拿多少分?

7?然后它是63.64%

8?它是72.73%

StratifiedShuffleSplit有时需要7,有时是8.因此每批次都有一个小差异。一切都很好。