我的数据集如下:
value identifier
2007-01-01 0.781611 55
2007-01-01 0.766152 56
2007-01-01 0.766152 57
2007-02-01 0.705615 55
2007-02-01 0.032134 56
2007-02-01 0.032134 57
2008-01-01 0.026512 55
2008-01-01 0.993124 56
2008-01-01 0.993124 57
2008-02-01 0.226420 55
2008-02-01 0.033860 56
2008-02-01 0.033860 57
经过一系列问题并且非常有帮助answers后,我提出了这个问题:
group = df.groupby(df.index)[['value']].mean()
group.index = pd.to_datetime(group.index) # probably a bug
group_month = group.groupby(group.index.month)
group_month.mean().plot()
所以我有一个每月平均值的折线图。现在我想生成一个boxplot,所以我用它:
ax = group_month.boxplot(subplots=False)
使用箱线图,平均值(箱形图中间的条形图)与上图不同。我预料到了吗? (我现在不能发布图表,似乎示例数据集没问题,但我有一个更大的数据集,它的格式完全相同,给我带来了麻烦)。 箱形图提供中位数,而不是平均数。