我想对存储在数据框中的某些数据查找自回归模型,我每天有96个数据点。数据是某些地区太阳辐照度的值,我知道它具有1天的季节性。我想使用scikit LinearRegression获得一个简单的线性模型,并且想要指定要使用的滞后数据点。我想使用最后10个数据点,再加上滞后时间为97(对应于24小时之前的数据点)的数据点。如何指定要使用的滞后系数?我不想有97个系数,我只想使用11个系数:前10个数据点和97个数据点都位于后面。
答案 0 :(得分:1)
只需创建一个包含11列X
的数据集[x0-97, x0-10, x0-9,...,x0-1]
。然后一系列x0
将成为您的目标Y
。