我有pandas数据框“ data”,并且只想保留总和的行 每个类别“类别”的“麻木人”总数至少为2。
但是,这将引发索引错误(索引不再匹配):
data = data[data.groupby('class').sum()['numb_people'] > 2]
如何以类似的简单方式做到这一点?
答案 0 :(得分:1)
@rafaelc在评论中说:
idx = data.groupby('class').numb_people.transform('sum') > 2
print(data[idx])