我有一个缩写月份,day_of_month和一些其他数据的数据框。我按月计算小组,按月分类。但我最终在结果中按字母顺序排列。 4月,8月,2月......而不是1月,2月,3月......
示例代码:
np.random.seed(1)
n=30
df=pd.DataFrame({'months':np.random.choice(['Jan','Feb','Mar','Apr','May','Jun','Jul','Aug','Sep','Oct','Nov','Dec'],size=n),
'data':np.random.randint(1000,size=n),
'day_of_month':np.random.randint(1,31,size=n),
'filename':np.random.choice(['f1','blah','foo','bar','meh'],size=n)})
df.groupby(["months","day_of_month"]).count()
以下是示例输出:
months day_of_month data filename
Aug 6 1 1
24 1 1
26 1 1
30 1 1
Dec 10 1 1
17 1 1
23 1 1
Feb 5 1 1
28 1 1
Jan 1 1 1
16 1 1
26 1 1
Jul 16 1 1
20 1 1
Jun 19 1 1
21 1 1
27 1 1
如何确保数据框按月和day_of_month分组,然后按适当的时间顺序按月分类?