pd.resample
函数接受从数组到数字的任何函数作为其how
关键字参数(尽管它不在docs中)。所以下面的例子效果很好
#!/usr/bin/python
import numpy as np
import pandas as pd
dates = pd.date_range('20130101', periods=60)
df = pd.DataFrame(np.random.randn(60,4), index=dates, columns=list('ABCD'))
print df.resample('10D', how=np.std, axis=0)
但是,有没有办法用返回数组的函数做同样的事情?例如,如果我尝试df.resample('10D', how=np.fft.rfft, axis=0)
pandas将退出:
Exception: Data must be 1-dimensional
现在,有没有一种方法可以使用rfft
这样的函数和偏移字符串功能(例如,如果我想要每个" 10Min"在我的数据中阻塞)?
我知道我可以用groupby或者首先分离数据帧,但是因为pandas'偏移字符串非常容易使用(它在我的实际数据分析领域特别有用)我想知道如何做到这一点并且不会失去它的功能。
修改的
如果我尝试df.groupby(pd.TimeGrouper('10D')).apply(np.fft.rfft, axis=0)
,则会给我这个错误:
TypeError: cannot concatenate a non-NDFrame object
答案 0 :(得分:0)
因为fft函数改变了输入的形状,所以不能直接应用它。这将是一种包装它的方法。
In [331]: def wrap_fft(df):
...: return pd.DataFrame({c:np.fft.rfft(df[c]) for c in df})
In [332]: df.groupby(pd.TimeGrouper('10D')).apply(wrap_fft)
Out[332]:
A \
2013-01-01 0 (0.54057835524+0j)
1 (3.58718639626-2.07316200855j)
2 (1.31007762632+1.22430332479j)
3 (4.36758085029-0.236242884113j)
4 (-0.0546232575249+2.11668684871j)
5 (1.55071284264+0j)
2013-01-11 0 (4.11929430037+0j)
1 (-0.93001545894-2.65804406349j)
2 (1.20206318744-1.43815460311j)
3 (1.24340282215-4.38679576432j)
4 (-0.582004943723-0.943867990404j)
5 (-1.81316546447+0j)
2013-01-21 0 (-1.49246511083+0j)
1 (-1.15010974637+0.527648266336j)
2 (-2.5428259911+2.36604684921j)
3 (-2.76468733089+0.860053921011j)
4 (-1.41328489201-0.36756122307j)
5 (-3.13773122523+0j)
.........