我有一个数据框,其中一列为日期时间格式,另一列为整数和浮点数。我想按第一列的工作日对数据框进行分组。其他列将被添加。
print (df)
Day Butter Bread Coffee
2019-07-01 00:00:00 2 2 4
2019-07-01 00:00:00 1 2 1
2019-07-02 00:00:00 5 4 8
基本上,结果有时是相同的:
print (df)
Day Butter Bread Coffee
Monday 3 4 5
Tuesday 5 4 8
如果可以说星期一,星期二的第一天是MO还是01,我会很灵活,只要可以看到星期一,星期二,星期三,星期四,星期五,星期六和星期日是哪个消费时段。< / p>
答案 0 :(得分:0)
尝试使用.dt.day_name()和groupby(),sum()
df = pd.DataFrame(data={'day':['2019-07-01 00:00:00','2019-07-01 00:00:00','2019-07-02 00:00:00'],
'butter':[2,1,5],
'bread':[2,2,4],
'coffee':[4,1,8]})
df['day'] = pd.to_datetime(df['day']).dt.day_name()
df.groupby(['day'],as_index=False).sum()
day butter bread coffee
0 Monday 3 4 5
1 Tuesday 5 4 8
答案 1 :(得分:0)
您应将“天”转换为日期时间类型,然后可以提取星期几并汇总其余各列:
import pandas as pd
df['Day'] = pd.to_datetime(df['Day'])
df.groupby(df['Day'].dt.day_name()).sum()