对于我的评估,我想运行此网址中找到的数据集的滚动1000窗口OLS regression estimation
:
https://drive.google.com/open?id=0B2Iv8dfU4fTUa3dPYW5tejA0bzg
使用以下Python
脚本。
# /usr/bin/python -tt
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from statsmodels.formula.api import ols
df = pd.read_csv('estimated.csv', names=('x','y'))
model = pd.stats.ols.MovingOLS(y=df.Y, x=df[['y']],
window_type='rolling', window=1000, intercept=True)
df['Y_hat'] = model.y_predict
但是,当我运行我的Python脚本时,我收到此错误:AttributeError: module 'pandas.stats' has no attribute 'ols'
。这个错误可能来自我正在使用的版本吗?我的Linux节点上安装的pandas
版本为0.20.2
答案 0 :(得分:6)
pd.stats.ols.MovingOLS
http://pandas-docs.github.io/pandas-docs-travis/whatsnew.html#whatsnew-0200-prior-deprecations
https://github.com/pandas-dev/pandas/pull/11898
我无法找到一个“现成的”解决方案,因为滚动回归应该是一个明显的用例。
以下应该可以做到这一点,而无需在更优雅的解决方案上投入太多时间。它使用numpy根据回归参数和滚动窗口中的X值计算回归的预测值。
window = 1000
a = np.array([np.nan] * len(df))
b = [np.nan] * len(df) # If betas required.
y_ = df.y.values
x_ = df[['x']].assign(constant=1).values
for n in range(window, len(df)):
y = y_[(n - window):n]
X = x_[(n - window):n]
# betas = Inverse(X'.X).X'.y
betas = np.linalg.inv(X.T.dot(X)).dot(X.T).dot(y)
y_hat = betas.dot(x_[n, :])
a[n] = y_hat
b[n] = betas.tolist() # If betas required.
上面的代码相当于以下代码,速度提高了约35%:
model = pd.stats.ols.MovingOLS(y=df.y, x=df.x, window_type='rolling', window=1000, intercept=True)
y_pandas = model.y_predict
答案 1 :(得分:0)
deprecated支持statsmodels。