我有一个响应变量和超过3000个潜在的预测变量。我需要找到每个简单的线性模型并确定重要的模型。我不想做变量选择,因为我不想要预测器的最佳模型。我只想要3000个型号,每个型号有一个预测器。我没有尝试任何代码,因为我不知道如何解决这个问题。
答案 0 :(得分:1)
如果我是你,我会使用渐变增强机器进行一些变量选择,然后使用具有顶部特征的更简单的lm模型。我使用airquality数据集作为一个简单的例子。运行此代码时,您将看到变量在预测温度时的相对影响的摘要。当你拥有那么多变量时,依靠一些机器学习来点亮它就会容易得多。 -i
包的速度要快得多,Kaggle
xgboost