拆分不平衡(二进制)数据集,因此测试集的假样本和阳性样本数量相同

时间:2019-04-17 16:39:35

标签: python classification train-test-split

我正在尝试将NN应用于具有高度不平衡的二进制分类问题; 28k False(0.)和68k True(1.)。是否可以将train_test_split与stratify一起使用,以确保True和False事件在测试集中的比例相同,但不能确保训练集中的比例相同?例如;测试集-14k否,14k是。训练集-错14k,真54k。

0 个答案:

没有答案