平均值不正确

时间:2016-11-18 09:37:58

标签: python pandas

我正在尝试获取DataFrame中每个列项的均值。但是,当我使用df.groupby(level=0).mean()时,我一直得到错误的(更高)值。

我的数据框是从3个单独的文件连接起来的,所有文件都是按时间排序的,它看起来像这样:

>>> df.tail()
2016-11-18 19:58:00  12.97  12.96
2016-11-18 19:58:00  12.98  12.96
2016-11-18 19:58:00  12.97  12.96
2016-11-18 19:59:00  12.97  12.96
2016-11-18 19:59:00  12.97  12.96
2016-11-18 19:59:00  12.97  12.96
2016-11-18 20:00:00  12.97  12.96
2016-11-18 20:00:00  12.97  12.96
2016-11-18 20:00:00  12.97  12.96

然而,当我进行平均调用时,我得到了错误的值:

>>> df.groupby(level=0).mean()    
2016-11-18 19:58:00  13.125000  13.022500
2016-11-18 19:59:00  13.103636  13.030000
2016-11-18 20:00:00  13.078333  13.002500

哪个不对。如果我没弄错了以下内容:

2016-11-18 19:58:00  12.97  12.96
2016-11-18 19:58:00  12.98  12.96
2016-11-18 19:58:00  12.97  12.96

应该是平均值:

2016-11-18 19:58:00   12.973 12.96

为什么会发生这种情况?这可能是我的错误。

编辑:为了说清楚,我希望每个日期条目都有一个平均值。我不需要每列平均值。

1 个答案:

答案 0 :(得分:0)

df.tail().groupby(level=0).mean()

enter image description here

不同
df.groupby(level=0).mean()

如果df中的数据多于tail显示的数据。