如何删除熊猫中属于同一组的某些k个条目平衡班?

时间:2019-05-31 02:06:14

标签: python pandas

我目前具有以下标签分布

Lbl
0    10451
1     1481
dtype: int64

如何平衡标签?例如,仅选择1481的0?

将数据框设置为

index | 1 | 2 | 3 | ... | Lbl

谢谢

编辑: 添加图片以解决答案中讨论的问题: enter image description here

我得到上面的^^代码

print(table_train[:5])
table_train = table_train.groupby('Lbl').apply(lambda x : x.sample(1481)).reset_index(level=1, drop=True)
print(table_train[:5])

1 个答案:

答案 0 :(得分:1)

您可以在sample之后尝试使用groupby

df.groupby('Label').apply(lambda x : x.sample(1481)).reset_index(level=0,drop=True)