我正在尝试使用剪切功能来创建年龄间隔。不幸的是,我收到了与第一次休息的下端匹配的值的NAs。
例如:
AGE <- sample(18:50, 100, replace = TRUE)
AGE_GROUPS <- cut(AGE, breaks = c(18, 27, 36, 45))
DF <- data.frame(AGE, AGE_GROUPS)
对于AGE为18且高于45的所有值,我在AGE_GROUPS变量中接收NA。如何确保AGE_GROUPS中的最低括号包含18,如何确保最高括号包含所有值&gt; = 45?
答案 0 :(得分:5)
休息不仅仅是中间休息,也是端点。您可以确保使用
获得所有内容breaks = c(-Inf, 18, 27, 36, 45, Inf)
更保守一点,你可以使用
breaks = c(0, 18, 27, 36, 45, 120)
可用于捕获异常值编码错误。您可能还需要include.lowest = TRUE
。有关示例,请参阅?cut
。