我有一个数据框,每个特定user_id
有多行,我正在尝试创建一个新的数据框,汇总每个user_id
的值。例如,原始数据框df
是
id user_id eventdate col1 col2
1 100 2015-10-01 2 A
2 200 2015-11-01 4 B
3 300 2015-12-01 1 A
4 100 2016-02-01 3 B
5 300 2016-03-01 6 C
从此我想为每个用户创建一个新的数据框df_agg
,如下所示:
user_id col1_sum col2_latest
100 5 B
200 4 B
300 7 C
我通过像这样的小组来获得col1_sum
:
df_agg = pd.DataFrame({'col1_sum': df.groupby('NAME')['col1'].sum()})
如何将col2_latest
列添加到此数据框?