我有一个包含日期(日期时间格式)的大数据框和包含类别的项目:
例如:
日期;类别;项目
2015-05-13 23:53:00;一个 ;乙
我想在"年中制作一个项目数量的图表" (圣诞节有多少项,不取决于年份)
到目前为止,我已经创建了一个新专栏' DayOfYear'包含"月 - 日"以字符串形式(例如:12-24),我按此属性分组以计算项目数
different_enough
它给了我一张与我想要的相差不远的表格:
df = df[['Category','DayOfYear']].groupby(['DayOfYear']).count()
但是当我把它放到图表中时,这是胡说八道:DayOfYear没有反映日期,所以它按错误的顺序排序
知道如何做到这一点?我应该保留日期时间格式吗?
答案 0 :(得分:0)
我找到了办法:)
我没有为月 - 日构建字符串,而是添加了一个日期时间格式为%M-%d的列
然后我按数据分组来计算一年中每一天的项目数,并绘制了这个分组数据中项目数的图表