R分类变量值

时间:2016-07-05 11:33:52

标签: r

是否有命令来查看分类变量的编码方式?

例如,我有一个名为HbA1c的变量,我看到的类别是< 5.7和> = 5.7。我想知道< 5.7和> = 5.7采取什么值(如果它是0或1或2)。我需要它进行回归分析。

如果这个问题已经解决,我很抱歉,但我找不到帖子。

提前谢谢你。

1 个答案:

答案 0 :(得分:3)

如果x因子(R中分类变量的技术名称),那么levels(x)会按顺序为您提供级别,所以类似

setNames(1:length(levels(f)),levels(f))
## a b c 
## 1 2 3 

会给你一张对应表。

您在评论中的问题并不完全清楚,但如果您想要使用从零开始的数值运行回归,我会尝试类似:

mydata$n <- as.numeric(mydata$f)-1

(与因子关联的数字代码始终从1到N运行;这为您提供了从0到N-1的数字变量)。然后你可以运行这样的回归:

lm(y~n,data=mydata)