我正在尝试训练分类模型,并且在我的train_test分裂中遇到强烈的不平衡。我尝试了几种不同的随机状态。我的整个样本的细分为:每班24/19/57
。肯定存在不平衡,但是当我进行train_test分割时,我最终会得出这个细分:每班5/0.1/94.9
。有没有人知道为什么会这样?
这就是我所拥有的。
Text_train, Text_test, label_train, label_test = \
train_test_split(X, y, test_size=0.25, random_state = 42)
有什么想法?