我有一个数据集,其中所有列都是数字,其中一些列具有级别大于等于2的数字形式的类别。 我是否需要将该分类数值列转换为因子以进行回归分析? 请提出R中任何更好的方法。
答案 0 :(得分:0)
是的。你可以自己证明...
x <- rep(1:5, 20)
y <- rnorm(100)
# not converting to factors
m1 <- lm (y ~ x)
# converting to factors
m2 <- lm(y ~ as.factor(x) )
summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients