我对R及其功能相对较新,但我听说过有关leaps
和glmnet
的好消息。有没有办法在具有大量解释变量的数据集上使用模型选择包glmnet
或leaps
?我想用它们拟合一个模型,但我有大约100个不同的变量,我发现的例子似乎暗示我必须手动输入每个变量。我基本上在寻找一种方法,让我选择一个列作为响应变量,然后接受所有其他列进行模型选择,或者将第一列作为响应,将所有其他列作为解释变量。
答案 0 :(得分:0)
问题的解决方案实际上内置于R语言的语法中。
您所做的只是使用您的响应和解释变量准备数据集,然后键入:
glmnet(y ~ ., data = data)
添加您喜欢的任何其他选项。点运算符告诉它使用所有其他列作为解释变量。
你也可以做这样的事情,使用所有变量吧:
result <- glmnet(y ~ . - x3, data = data)
技术上,。表示公式中尚未提及的所有变量。例如
result <- glmnet(y ~ x1 * x2 + ., data = data)
您还可以执行其他操作,例如使用循环以编程方式将变量名称分配给列表,但这应该是最简单的解决方案。