我有一个包含多个日期的数据框,并针对每个日期进行计数。日期可以多次出现。我使用以下方法对数据进行分组以绘制时间序列:
timeseries = df[['date','count']].groupby(['date']).sum().reset_index()
这让我可以想象我需要什么,但是当我尝试使用以下方法查看确切的值时:
timeseries.sort('count', ascending=False)['count'][:5]
日期以索引方式打印:
Date Count
1695 1529
1349 1013
1692 956
998 637
997 636
Name: count, dtype: int64
似乎我正在做一些基本错误的事情,导致我失去日期值并改为维持索引。
答案 0 :(得分:0)
您的问题的解决方案要求您了解圆柱名称“日期”与名为“日期”的索引之间的区别。然后,您的对象类型的日期列,需要与datetime类似。
此外,您的日期列可能需要转换,请尝试使用http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.convert_objects.html
而且,您不需要在最后重置索引。