剪切函数返回间隔的NA

时间:2017-12-13 20:58:02

标签: r cut

我正在尝试使用剪切功能来创建年龄间隔。不幸的是,我收到了与第一次休息的下端匹配的值的NAs。

例如:

AGE <- sample(18:50, 100, replace = TRUE)
AGE_GROUPS <- cut(AGE, breaks = c(18, 27, 36, 45))
DF <- data.frame(AGE, AGE_GROUPS)

对于AGE为18且高于45的所有值,我在AGE_GROUPS变量中接收NA。如何确保AGE_GROUPS中的最低括号包含18,如何确保最高括号包含所有值&gt; = 45?

1 个答案:

答案 0 :(得分:5)

休息不仅仅是中间休息,也是端点。您可以确保使用

获得所有内容
breaks = c(-Inf, 18, 27, 36, 45, Inf)

更保守一点,你可以使用

breaks = c(0, 18, 27, 36, 45, 120)

可用于捕获异常值编码错误。您可能还需要include.lowest = TRUE。有关示例,请参阅?cut