熊猫使用numpy百分位重新取样?

时间:2013-10-31 09:52:08

标签: python numpy pandas

使用pandas函数resample ??

时,您是否使用过百分位数numpy函数?

考虑到"数据"是一个只有一列10分钟数据的数据框,我想做这样的事情:

dataDaily=data.resample('D',how=np.percentile(data['Col1'],q=90)

我收到以下错误:

'numpy.float64' object is not callable

你试过这个吗?

1 个答案:

答案 0 :(得分:4)

您必须将函数传递给how参数,而不是值。我认为在你的情况下你可以使用匿名函数(lambda函数):

dataDaily = data.resample('D', how=lambda x: np.percentile(x['Col1'], q=90))

示例:

>>> df = pd.DataFrame({'Col1': np.random.randn(10)})
>>> df.index = map(pd.Timestamp, ['20130101', '20130102']) * 5)
>>> df
                Col1
2013-01-01 -0.636815
2013-01-02 -0.028921
2013-01-01  0.643083
2013-01-02  0.065096
2013-01-01  0.446963
2013-01-02  0.462307
2013-01-01  2.768514
2013-01-02 -1.406168
2013-01-01  0.732656
2013-01-02 -0.699028
>>> df.resample('D', how=lambda x: np.percentile(x['Col1'], q=90))
                Col1
2013-01-01  1.954171
2013-01-02  0.303423