将自定义滚动功能应用于数据框

时间:2017-08-05 02:40:15

标签: python pandas numpy

尝试将自定义滚动功能应用于pandas数据框时,我收到异常。例如:

import statsmodels.api as sm
import pandas as pd
import numpy as np

def univar_regr_beta(y, x):
    Y, X = y.as_matrix(), x.as_matrix()

    X = sm.add_constant(X)

    model = sm.OLS(Y, X)
    return model.fit().params[1]

df = pd.DataFrame(np.random.randn(20,3))
srs = pd.Series(np.random.randn(20))

# this returns a value e.g.: 0.06608957
univar_regr_beta(df[0], srs)

# and this returns a rolling sum dataframe
df.rolling(5, 5).apply(np.sum)

# but this breaks when attemp to get rolling beta
df.rolling(5, 5).apply(lambda x: univar_regr_beta(x, srs))

具体而言,我得到的例外情况如下:

AttributeError: 'numpy.ndarray' object has no attribute 'as_matrix'

看起来好像每个列都是通过lambda传递给univar_regr_beta时,它是作为一个颠簸的数组而不是一个系列传递的。我不确定是否有更好的方法来实现滚动测试版,或者我是否只是遗漏了某些内容。

感谢任何帮助。感谢

0 个答案:

没有答案