我试图在R
中运行逐步回归,其中包含600个奇数变量,作为.csv文件标题中的列名。
如何在回归方程中使用列名作为变量?
我对此非常陌生并且我对它的理解有限,我可以将列保存为列表并使用它来运行glm,例如
model.1 <- glm(x~ paste(list), family= poisson, link = logit).
非常感谢任何帮助。提前谢谢
答案 0 :(得分:3)
如果您已正确读取数据(例如,使用上面评论中指定的header=TRUE
),您最终应该使用600 +列数据框(x
响应为1列,以及每个预测变量的列):我现在称之为mydata
。在这种情况下,@ TylerRinker建议你可以只包括所有预测变量:glm(x~.,data=mydata,family=poisson)
(logit链接是默认链接;如果你想明确指定它,你可以说glm(x~.,data=mydata,family=poisson(link="logit"))
。然后你可以使用{来自MASS包的{1}}或step
。
但是,我必须补充说,除非你知道自己在做什么,否则对600个变量的逐步回归是一个统计的 真的,真的,真的很不好 的想法观点(谷歌类似“逐步回归问题”或“逐步回归哈雷尔”)。我强烈建议您查看类似stepAIC
包的内容,该方法采用更为合理的方法进行大量预测变量的建模。