是否有命令来查看分类变量的编码方式?
例如,我有一个名为HbA1c的变量,我看到的类别是< 5.7和> = 5.7。我想知道< 5.7和> = 5.7采取什么值(如果它是0或1或2)。我需要它进行回归分析。
如果这个问题已经解决,我很抱歉,但我找不到帖子。
提前谢谢你。
答案 0 :(得分:3)
如果x
是因子(R中分类变量的技术名称),那么levels(x)
会按顺序为您提供级别,所以类似
setNames(1:length(levels(f)),levels(f))
## a b c
## 1 2 3
会给你一张对应表。
您在评论中的问题并不完全清楚,但如果您想要使用从零开始的数值运行回归,我会尝试类似:
mydata$n <- as.numeric(mydata$f)-1
(与因子关联的数字代码始终从1到N运行;这为您提供了从0到N-1的数字变量)。然后你可以运行这样的回归:
lm(y~n,data=mydata)