我有一系列datetime
个对象和一系列跨越数年的数据。 A可以创建Series
对象并重新对其进行重新抽样,以便按月分组:
df=pd.Series(varv,index=dates)
multiMmean=df.resample("M", how='mean')
print multiMmean
然而,这是输出
2005-10-31 172.4
2005-11-30 69.3
2005-12-31 187.6
2006-01-31 126.4
2006-02-28 187.0
2006-03-31 108.3
...
2014-01-31 94.6
2014-02-28 82.3
2014-03-31 130.1
2014-04-30 59.2
2014-05-31 55.6
2014-06-30 1.2
这是该系列每个月的平均值列表。这不是我想要的。我想要12个值,一年中每个月都有一个,这些年来每个月都有一个平均值。我如何获得multiMmean
?
我尝试在resample("M",how='mean')
上使用multiMmean
并列出了理解但我无法让它发挥作用。我错过了什么?
谢谢。
答案 0 :(得分:6)
以下为我工作:
# create some random data with datetime index spanning 17 months
s = pd.Series(index=pd.date_range(start=dt.datetime(2014,1,1), end = dt.datetime(2015,6,1)), data = np.random.randn(517))
In [25]:
# now calc the mean for each month
s.groupby(s.index.month).mean()
Out[25]:
1 0.021974
2 -0.192685
3 0.095229
4 -0.353050
5 0.239336
6 -0.079959
7 0.022612
8 -0.254383
9 0.212334
10 0.063525
11 -0.043072
12 -0.172243
dtype: float64
因此我们可以groupby
datetimeindex的month
属性并调用mean
这将计算所有月份的平均值