我有一个数据帧df,如下所示:
| date | Revenue | Cost |
|-----------|---------|------|
| 6/1/2017 | 100 | 20 |
| 5/21/2017 | 200 | 40 |
| 5/21/2017 | 300 | 60 |
| 6/20/2017 | 400 | 80 |
| 6/1/2017 | 500 | 100 |
我需要按月将上述数据分组,然后按天分组以获得输出:
| Month | Day | SUM(Revenue) | SUM(Cost) |
|-------|-----|--------------|-----------|
| May | 21 | 500 | 100 |
| June | 1 | 600 | 120 |
| June | 20 | 400 | 80 |
我尝试了这段代码但是没有用:
df.groupby(month('date'), day('date')).agg({'Revenue': 'sum', 'Cost': 'sum' })
我想只使用Pandas或Numpy而不使用其他库
答案 0 :(得分:4)
我们将set_index
和sum
与参数level
一起使用:
df['date'] = pd.to_datetime(df['date'])
df['Month'] = df['date'].dt.strftime('%b')
df['Day'] = df['date'].dt.day
df.set_index(['Month','Day']).sum(level=[0,1]).reset_index()
输出:
Month Day Revenue Cost
0 Jun 1 600 120
1 Jun 20 400 80
2 May 21 500 100