我正在尝试获取DataFrame中每个列项的均值。但是,当我使用df.groupby(level=0).mean()
时,我一直得到错误的(更高)值。
我的数据框是从3个单独的文件连接起来的,所有文件都是按时间排序的,它看起来像这样:
>>> df.tail()
2016-11-18 19:58:00 12.97 12.96
2016-11-18 19:58:00 12.98 12.96
2016-11-18 19:58:00 12.97 12.96
2016-11-18 19:59:00 12.97 12.96
2016-11-18 19:59:00 12.97 12.96
2016-11-18 19:59:00 12.97 12.96
2016-11-18 20:00:00 12.97 12.96
2016-11-18 20:00:00 12.97 12.96
2016-11-18 20:00:00 12.97 12.96
然而,当我进行平均调用时,我得到了错误的值:
>>> df.groupby(level=0).mean()
2016-11-18 19:58:00 13.125000 13.022500
2016-11-18 19:59:00 13.103636 13.030000
2016-11-18 20:00:00 13.078333 13.002500
哪个不对。如果我没弄错了以下内容:
2016-11-18 19:58:00 12.97 12.96
2016-11-18 19:58:00 12.98 12.96
2016-11-18 19:58:00 12.97 12.96
应该是平均值:
2016-11-18 19:58:00 12.973 12.96
为什么会发生这种情况?这可能是我的错误。
编辑:为了说清楚,我希望每个日期条目都有一个平均值。我不需要每列平均值。