用分类变量建立回归模型

时间:2015-09-24 15:36:56

标签: r regression

您好我是R的新手,我希望有人可以给我一些建立回归模型的提示。我有一些类似于下面的示例数据的示例数据,其中包含分类变量,如路径变量。我想将这些分类变量转换为二进制变量,如"转换数据"如下所示,我可以使用它们创建回归模型,根据每条路径上的Volume预测WaitTime。在python中有一个名为getdummies的函数可以很好地完成这项工作。如果有人能给我关于r中类似函数的提示,或者建立一个带有分类变量的回归模型的方法。我将不胜感激。我的最终目标是构建回归模型,然后找到最小化WaitTIme的每个路径的音量值。关于这一点的任何提示肯定会受到赞赏 样本数据: Path WaitTime Volume AD_IB 195 3 GMC_DT 154 4 CD_ADT 192 2 Ord_IB 326 1

转化数据:
AD_IB GMC_DT CD_ADT Ord_IB WaitTime Volume 1 0 0 0 195 3 0 1 0 0 154 4 0 0 1 0 192 2 0 0 0 1 326 1

1 个答案:

答案 0 :(得分:2)

R会自动为您执行此操作:

set.seed(1)
d <- data.frame(cat = factor(LETTERS[sample(3, 100, TRUE)]), y = rnorm(100))
lm(y ~ cat, d)

#     # Call:
# lm(formula = y ~ cat, data = d)
# 
# Coefficients:
# (Intercept)         catB         catC  
#     -0.2385       0.3518       0.2493