将分类数值变量转换为连续形式以解决回归问题

时间:2019-03-07 20:54:23

标签: r machine-learning regression data-analysis regression-testing

我有一个数据集,其中所有列都是数字,其中一些列具有级别大于等于2的数字形式的类别。 我是否需要将该分类数值列转换为因子以进行回归分析? 请提出R中任何更好的方法。

1 个答案:

答案 0 :(得分:0)

是的。你可以自己证明...

x <- rep(1:5, 20)
y <- rnorm(100)

# not converting to factors
m1 <- lm (y ~ x)

# converting to factors
m2 <- lm(y ~ as.factor(x) )

summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients