尝试将自定义滚动功能应用于pandas数据框时,我收到异常。例如:
import statsmodels.api as sm
import pandas as pd
import numpy as np
def univar_regr_beta(y, x):
Y, X = y.as_matrix(), x.as_matrix()
X = sm.add_constant(X)
model = sm.OLS(Y, X)
return model.fit().params[1]
df = pd.DataFrame(np.random.randn(20,3))
srs = pd.Series(np.random.randn(20))
# this returns a value e.g.: 0.06608957
univar_regr_beta(df[0], srs)
# and this returns a rolling sum dataframe
df.rolling(5, 5).apply(np.sum)
# but this breaks when attemp to get rolling beta
df.rolling(5, 5).apply(lambda x: univar_regr_beta(x, srs))
具体而言,我得到的例外情况如下:
AttributeError: 'numpy.ndarray' object has no attribute 'as_matrix'
看起来好像每个列都是通过lambda传递给univar_regr_beta时,它是作为一个颠簸的数组而不是一个系列传递的。我不确定是否有更好的方法来实现滚动测试版,或者我是否只是遗漏了某些内容。
感谢任何帮助。感谢