如何在R中使用数据头作为变量名

时间:2012-09-27 15:50:07

标签: r variables header

我试图在R中运行逐步回归,其中包含600个奇数变量,作为.csv文件标题中的列名。

如何在回归方程中使用列名作为变量?

我对此非常陌生并且我对它的理解有限,我可以将列保存为列表并使用它来运行glm,例如

model.1 <- glm(x~ paste(list), family= poisson, link = logit).

非常感谢任何帮助。提前谢谢

1 个答案:

答案 0 :(得分:3)

如果您已正确读取数据(例如,使用上面评论中指定的header=TRUE),您最终应该使用600 +列数据框(x响应为1列,以及每个预测变量的列):我现在称之为mydata。在这种情况下,@ TylerRinker建议你可以只包括所有预测变量:glm(x~.,data=mydata,family=poisson)(logit链接是默认链接;如果你想明确指定它,你可以说glm(x~.,data=mydata,family=poisson(link="logit"))。然后你可以使用{来自MASS包的{1}}或step

但是,我必须补充说,除非你知道自己在做什么,否则对600个变量的逐步回归是一个统计的 真的,真的,真的很不好 的想法观点(谷歌类似“逐步回归问题”或“逐步回归哈雷尔”)。我强烈建议您查看类似stepAIC包的内容,该方法采用更为合理的方法进行大量预测变量的建模。