建立具有时滞变量的最佳拟合多元回归模型的策略

时间:2013-05-14 09:53:17

标签: algorithm r machine-learning regression

我正在建立一个多元回归模型 - 包含在一个函数中 - 带有一个因变量和十几个自变量。我正在构建函数的原因是我需要使用大约75个不同的数据集进行此分析。

挑战在于,当它们在时间上滞后时,自变量与因变量更好地相关。不幸的是,并非每个变量的所有时间滞后都相同,我想确定每个变量的时间滞后的最佳组合,同时获得多元回归模型的最佳调整R ^ 2值。此外,在构建初始模型后,我将尝试使用模型上的step(modelbase, direction="both")函数来减少模型。

在我目前的方法中,我将所有自变量的时间滞后于相同的周数。这导致了最好的模型,其中所有自变量具有相同的时间滞后,但我相信(有一个有效的假设支持这一点),当我们区分每个自变量的时滞时,存在更好的模型。我的问题是,在不增加选项数量的情况下,确定最佳拟合模型的最佳策略是什么。如果我想确定12个独立变量的每周步骤0到20周的时间滞后,我很快就会尝试找到4.096e + 15个变量(= 20 ^ 12)之间的匹配。

我可以想象通过以下策略减少问题:首先在不同的时间滞后找到一个具有一个自变量的最佳拟合模型。第二步是添加第二个具有不同时间滞后的自变量,并找到具有两个独立变量的最佳模型,其中第二个在不同时间滞后尝试,而第一个保持不变。然后添加第三个变量,我们采用类似的方法作为第二个变量,保持前两个变量不变,然后更改尝试第三个不同的时间滞后。有些东西告诉我这个策略可能是不错的方法,但也可能是一个更好的整体模型,其中包含每个独立变量的非最佳变量。

是否有人对如何应对这一挑战有所启发?

0 个答案:

没有答案