年龄如何分类为分类变量?

时间:2019-12-18 11:55:31

标签: python r categorical-data binning

好的,这个问题很基本,但是我听不懂,所以需要您的帮助。 我了解将年龄分成类别的想法。 例如 : good graph (:

我不了解模型如何知道30 <类别在31-45类别之前,为什么31-45类别在46-60类别之前,等等。模型如何知道不制作此图-- bad graph ):

谢谢!

1 个答案:

答案 0 :(得分:2)

考虑以下示例:

age = 1:100

fctr <- as.factor(cut(age, breaks = c(0,25,50,75,100)))

print(levels(fctr))

[1] "(0,25]"   "(25,50]"  "(50,75]"  "(75,100]"

您可以在其中看到如何订购等级。这是plot和ggplot2将使用的顺序。您可以通过以下方式更改此顺序:

fctr2 <- factor(fctr,levels(fctr)[c(2,1,3,4)])

print(levels(fctr2))

[1] "(25,50]"  "(0,25]"   "(50,75]"  "(75,100]"

如果您经常处理各种因素,请考虑使用forcats软件包。