我有一个如下所示的数据框:
import pandas as pd
df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)})
grouped = df.groupby('A')
print grouped.head()
A B
A
one 0 one 0
1 one 1
5 one 5
three 3 three 3
4 three 4
two 2 two 2
我可以通过以下方式轻松选择每个组的最后几行:
print(grouped.agg(lambda x: x.iloc[-1]))
B
A
one 5
three 4
two 2
如何删除每个组的最后一行?结果将是:
A B
0 one 0
1 one 1
3 three 3
我尝试过滤但似乎没有做任何事情:
print grouped.filter(lambda x: x.iloc[-1])
A B
0 one 0
1 one 1
5 one 5
3 three 3
4 three 4
2 two 2
谢谢
答案 0 :(得分:8)
怎么样:
>>> df.groupby("A", as_index=False).apply(lambda x: x.iloc[:-1])
A B
0 one 0
1 one 1
3 three 3
[3 rows x 2 columns]
答案 1 :(得分:5)
您可能会发现使用cumcount的速度更快:
In [11]: df[grouped.cumcount(ascending=False) > 0]
Out[11]:
A B
0 one 0
1 one 1
3 three 3