找到3000多个变量的简单线性回归模型,以找到重要变量

时间:2016-02-23 03:01:38

标签: r

我有一个响应变量和超过3000个潜在的预测变量。我需要找到每个简单的线性模型并确定重要的模型。我不想做变量选择,因为我不想要预测器的最佳模型。我只想要3000个型号,每个型号有一个预测器。我没有尝试任何代码,因为我不知道如何解决这个问题。

1 个答案:

答案 0 :(得分:1)

如果我是你,我会使用渐变增强机器进行一些变量选择,然后使用具有顶部特征的更简单的lm模型。我使用airquality数据集作为一个简单的例子。运行此代码时,您将看到变量在预测温度时的相对影响的摘要。当你拥有那么多变量时,依靠一些机器学习来点亮它就会容易得多。 -i包的速度要快得多,Kaggle

上有很多例子
xgboost