按月计算的聚合值平均值和箱图平均值在pandas数据框架上有所不同

时间:2015-04-17 18:39:10

标签: python pandas

我的数据集如下:

     value     identifier
2007-01-01  0.781611      55
2007-01-01  0.766152      56
2007-01-01  0.766152      57
2007-02-01  0.705615      55
2007-02-01  0.032134      56
2007-02-01  0.032134      57
2008-01-01  0.026512      55
2008-01-01  0.993124      56
2008-01-01  0.993124      57
2008-02-01  0.226420      55
2008-02-01  0.033860      56
2008-02-01  0.033860      57

经过一系列问题并且非常有帮助answers后,我提出了这个问题:

group = df.groupby(df.index)[['value']].mean()
group.index = pd.to_datetime(group.index) # probably a bug
group_month = group.groupby(group.index.month)
group_month.mean().plot()

所以我有一个每月平均值的折线图。现在我想生成一个boxplot,所以我用它:

ax = group_month.boxplot(subplots=False)

使用箱线图,平均值(箱形图中间的条形图)与上图不同。我预料到了吗? (我现在不能发布图表,似乎示例数据集没问题,但我有一个更大的数据集,它的格式完全相同,给我带来了麻烦)。 箱形图提供中位数,而不是平均数。

0 个答案:

没有答案