在大型数据集上使用Leap或glmnet

时间:2014-08-22 13:08:16

标签: r

我对R及其功能相对较新,但我听说过有关leapsglmnet的好消息。有没有办法在具有大量解释变量的数据集上使用模型选择包glmnetleaps?我想用它们拟合一个模型,但我有大约100个不同的变量,我发现的例子似乎暗示我必须手动输入每个变量。我基本上在寻找一种方法,让我选择一个列作为响应变量,然后接受所有其他列进行模型选择,或者将第一列作为响应,将所有其他列作为解释变量。

1 个答案:

答案 0 :(得分:0)

问题的解决方案实际上内置于R语言的语法中。

您所做的只是使用您的响应和解释变量准备数据集,然后键入:

glmnet(y ~ ., data = data)

添加您喜欢的任何其他选项。点运算符告诉它使用所有其他列作为解释变量。

你也可以做这样的事情,使用所有变量吧:

result <- glmnet(y ~ . - x3, data = data)

技术上,。表示公式中尚未提及的所有变量。例如

result <- glmnet(y ~ x1 * x2 + ., data = data)

您还可以执行其他操作,例如使用循环以编程方式将变量名称分配给列表,但这应该是最简单的解决方案。