熊猫滚动适用于缺少数据

时间:2012-11-15 20:27:19

标签: python pandas missing-data rolling-computation

我想对丢失的数据进行滚动计算。

示例代码:(为了简单起见,我给出了一个滚动总和的例子,但我想做一些更通用的事情。)

foo = lambda z: z[pandas.notnull(z)].sum() 
x = np.arange(10, dtype="float")    
x[6] = np.NaN
x2 = pandas.Series(x)    
pandas.rolling_apply(x2, 3, foo)

产生:

0   NaN    
1   NaN
2     3    
3     6    
4     9    
5    12    
6   NaN    
7   NaN    
8   NaN    
9    24

我认为在“滚动”期间,计算中忽略了缺少数据的窗口。我希望得到一个结果:

0   NaN    
1   NaN    
2     3    
3     6    
4     9    
5    12    
6     9    
7    12    
8    15    
9    24

1 个答案:

答案 0 :(得分:10)

In [7]: pandas.rolling_apply(x2, 3, foo, min_periods=2)
Out[7]: 
0   NaN
1     1
2     3
3     6
4     9
5    12
6     9
7    12
8    15
9    24