我正在使用来自包鼠标的boys数据集中的数据。当我对其中一个因子变量(phb)运行回归时,输出会显示因子,但会给它们提供与数据不同的名称。我想知道为什么会这样。有没有办法纠正它?
library(mice)
data(boys)
# phb is already an ordered factor
table(boys$phb)
P1 P2 P3 P4 P5 P6
63 40 19 32 50 41
>summary(lm(age~factor(phb),data=boys))
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 14.22660 0.09610 148.033 <2e-16 ***
factor(phb).L 6.24873 0.20493 30.492 <2e-16 ***
factor(phb).Q 0.06451 0.23668 0.273 0.785
factor(phb).C 0.10205 0.22300 0.458 0.648
factor(phb)^4 -0.12415 0.23413 -0.530 0.596
factor(phb)^5 -0.12713 0.27299 -0.466 0.642
所以,我的问题是为什么输出.L,.Q,.C,^ 4,^ 5?我做了一点研究,这似乎代表线性,二次,立方。为什么会这样?我希望它是因子(phb).P1等。
答案 0 :(得分:1)
尝试 factor(x,ordered = FALSE)