lm中因子的奇怪名称

时间:2015-10-13 21:28:53

标签: r regression categorical-data

我正在使用来自包鼠标的boys数据集中的数据。当我对其中一个因子变量(phb)运行回归时,输出会显示因子,但会给它们提供与数据不同的名称。我想知道为什么会这样。有没有办法纠正它?

library(mice)
data(boys)
# phb is already an ordered factor
table(boys$phb)

P1 P2 P3 P4 P5 P6 
63 40 19 32 50 41 

>summary(lm(age~factor(phb),data=boys))

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)   14.22660    0.09610 148.033   <2e-16 ***
factor(phb).L  6.24873    0.20493  30.492   <2e-16 ***
factor(phb).Q  0.06451    0.23668   0.273    0.785    
factor(phb).C  0.10205    0.22300   0.458    0.648    
factor(phb)^4 -0.12415    0.23413  -0.530    0.596    
factor(phb)^5 -0.12713    0.27299  -0.466    0.642    

所以,我的问题是为什么输出.L,.Q,.C,^ 4,^ 5?我做了一点研究,这似乎代表线性,二次,立方。为什么会这样?我希望它是因子(phb).P1等。

1 个答案:

答案 0 :(得分:1)

尝试          factor(x,ordered = FALSE)