您好我是R的新手,我希望有人可以给我一些建立回归模型的提示。我有一些类似于下面的示例数据的示例数据,其中包含分类变量,如路径变量。我想将这些分类变量转换为二进制变量,如"转换数据"如下所示,我可以使用它们创建回归模型,根据每条路径上的Volume预测WaitTime。在python中有一个名为getdummies的函数可以很好地完成这项工作。如果有人能给我关于r中类似函数的提示,或者建立一个带有分类变量的回归模型的方法。我将不胜感激。我的最终目标是构建回归模型,然后找到最小化WaitTIme的每个路径的音量值。关于这一点的任何提示肯定会受到赞赏
样本数据:
Path WaitTime Volume
AD_IB 195 3
GMC_DT 154 4
CD_ADT 192 2
Ord_IB 326 1
转化数据:
AD_IB GMC_DT CD_ADT Ord_IB WaitTime Volume
1 0 0 0 195 3
0 1 0 0 154 4
0 0 1 0 192 2
0 0 0 1 326 1
答案 0 :(得分:2)
R
会自动为您执行此操作:
set.seed(1)
d <- data.frame(cat = factor(LETTERS[sample(3, 100, TRUE)]), y = rnorm(100))
lm(y ~ cat, d)
# # Call:
# lm(formula = y ~ cat, data = d)
#
# Coefficients:
# (Intercept) catB catC
# -0.2385 0.3518 0.2493