我很难从预先存在的数值变量创建新的因子变量。我有一个数字变量Age和我参与者的年龄,但是想要创建一个因子变量,将参与者的年龄分类到不同的类别。每当我运行我的代码时,我都会收到错误:
“错误:缺少参数”no“,没有默认值。”
我尝试了以下代码的不同变体,例如没有引号的新因子级别,使用:for range等。我的代码如下。
data.frame%>%
mutate(Age = ifelse(Age < 20, "0"),
ifelse(Age >= 20 & Age <= 29, "1"),
ifelse(Age >=30 & Age <= 39, "2"),
ifelse(Age >= 40 & Age <=49, "3"),
ifelse(Age >= 50 & Age <= 59, "4"),
ifelse(Age >= 60 & Age <= 69, "5"),
ifelse(Age >= 70, "6", NA))
答案 0 :(得分:5)
cut()
是最简单的方法。
在基地R:
Age <- seq(10,80,by=10)
cut(Age,breaks=c(-Inf,seq(20,70,by=10),Inf),
right=FALSE,
labels=as.character(0:6))
我会让您根据自己的喜好将其嵌入mutate()
。
您的代码存在的问题是您没有正确嵌套选项:请仔细比较此代码段与您的代码......
Age = ifelse(Age < 20, "0",
ifelse(Age >= 20 & Age <= 29, "1",
ifelse(...,[yes],[no])))
答案 1 :(得分:3)
结束括号")"
应该结束所有ifelse
:
df1 <- data.frame(Age=c(1:80,NA))
df1%>%
mutate(Age_cat = factor(ifelse(Age < 20, "0",
ifelse(Age >= 20 & Age <= 29, "1",
ifelse(Age >=30 & Age <= 39, "2",
ifelse(Age >= 40 & Age <=49, "3",
ifelse(Age >= 50 & Age <= 59, "4",
ifelse(Age >= 60 & Age <= 69, "5",
ifelse(Age >= 70, "6", NA)))))))))
但是,您还应该知道dplyr
,这是case_when
的绝佳机会:
df1 %>%
mutate(Age_cat= factor(case_when(
.$Age < 20 ~ "0",
.$Age >= 20 & .$Age <= 29 ~ "1",
.$Age >= 30 & .$Age <= 39 ~"2",
.$Age >= 40 & .$Age <=49 ~ "3",
.$Age >= 50 & .$Age <= 59 ~ "4",
.$Age >= 60 & .$Age <= 69 ~ "5",
TRUE ~"6"))
)
Age Age_cat
1 1 0
2 2 0
3 3 0
4 4 0
5 5 0
...
13 13 0
14 14 0
15 15 0
16 16 0
17 17 0
18 18 0
19 19 0
20 20 1
21 21 1
22 22 1
23 23 1
24 24 1
...
79 79 6
80 80 6
81 NA <NA>