当有很多自变量时,写lm或glm公式的方法

时间:2014-11-08 05:06:08

标签: r statistics glm lm

我正在阅读如下数据集:

data<-read.csv("test.csv",sep=",",header=T)

test.csv的第一列是响应变量。其余20列是预测变量。如何为这种场景编写lm公式。将公式编写为

并不是一种正确的方法
modelfit<-lm(data[,1]~data[,2]+data[,3],+... )

1 个答案:

答案 0 :(得分:1)

这就是你应该这样做的方式

data<-read.csv("test.csv",sep=",",header=T)
variables <- colnames(data)
depVar <- variables[1]
indepVars <- variables[-1]
myformulae <- as.formula(paste(depVar,paste(indepVars,collapse=' + '),sep = ' ~ '))
modelfit <-lm(myformulae,data=data)