我按感兴趣的列将df分组:
grouped = df.groupby('columnA')
现在,我只保留至少5个成员的组:
grouped.filter(lambda x: len(x) >= 5)
如果我尝试:
df2 = grouped.filter(lambda x: len(x) >= 5)
我正在获取一个DataFrame,而不是一个GroupBy对象。那么执行过滤后如何保留GroupBy对象?
答案 0 :(得分:2)
一种解决方法是在过滤后的数据帧上调用groupby
方法
grouped = grouped.filter(lambda x: len(x) >= 5).groupby('columnA')