我在sklearn中使用stratifiedShuffleSplit
将训练数据分成批次。因此,我输入NN的每个批次将与训练集具有相同的等级比例。或者换句话说,我希望为每个批次保留与训练集相同的百分比。
我感到困惑的是,对于每次迭代,每批次都有一点点差异。它没有遵循训练集的确切百分比,尽管它有类似的趋势。为什么stratifiedShuffleSplit
没有给出确切的百分比?
所以现在,我只是自己编写代码以获得完全相同的百分比。
答案 0 :(得分:1)
想象一下,你有11分并想要70%的训练集。你会拿多少分?
7?然后它是63.64%
8?它是72.73%
StratifiedShuffleSplit
有时需要7,有时是8.因此每批次都有一个小差异。一切都很好。