关于在lm中处理许多二进制独立变量

时间:2014-11-08 21:57:30

标签: r statistics regression lm

使用lm构建线性回归模型时,数据集大约有20个独立变量。我是否需要明确地将其澄清为factor?如果必须,我该怎么做?逐一声明是非常繁琐的。

1 个答案:

答案 0 :(得分:1)

首先,检查哪些变量R已自动转换为带有命令的因子

str(mydata)

然后,如果您想轻松地将多个变量转换为因子,您可以执行以下操作: 创造一个" mycol"带有要转换为因子的列数的变量

mycol <- c(1,4,5,7:15)
mydata[,  mycol] <- lapply(mydata[,  mycol], as.factor) # to turn them into factor var.
mydata[, -mycol] <- lapply(mydata[, -mycol], as.factor) # to turn all the others into factor var.