首先,我知道关于R中的if / else语句有很多问题,但是没有一个问题对我的具体情况有帮助,而且我一直在努力解决这个问题。 / p>
我有一个如下所示的数据框:
metricx <- c(5, 4.8, 4.4, 3.6, 3.2, 2.1, 1.9, .5, .3, .1)
df <- as.data.frame(metricx)
我需要根据metricx的值(风险和答案)创建两个新变量。
我知道这有用......
df$risk <- ifelse(df$metricx >= 4.5, 'VERY HIGH', 'HIGH')
df$risk <- ifelse(df$metricx < 3.5, 'MEDIUM', df$risk)
df$risk <- ifelse(df$metricx < 2, 'LOW', df$risk)
但显然不是一种优雅或有效的方法,因为我必须多次这样做(我的数据集非常大,我有更多的组)。我的理解是,每次调用ifelse时R必须遍历每条记录,因此链式选项会更好。
我试过这个......
ifelse(df$metricx >= 4.5,
(df$risk <- 'VERY HIGH' &
df$answer <- 'Y')
,
ifelse(df$metricx >= 3.5,
(df$risk = 'HIGH' &
df$answer = 'Y')
,
ifelse(df$metricx >= 2,
(df$risk = 'MEDIUM' &
df$answer = 'Y')
,
ifelse(df$metricx >= .40,
(df$risk = 'LOW' &
df$answer = 'Y')
,
(df$risk = 'LOW' &
df$answer = 'N')
)
)
)
)
我试过这个......
if (df$metricx >= 4.5){
df$risk = 'VERY HIGH'
df$answer = 'Y'
} else if (df$metricx >= 3.5){
df$risk = 'HIGH'
df$answer = 'Y'
} else if (df$metricx >= 2){
df$risk = 'MEDIUM'
df$answer = 'Y'
} else if (df$metricx >= .40){
df$risk = 'LOW'
df$answer = 'Y'
} else {
df$risk = 'LOW'
df$answer = 'N'
}
他们都给出了不同的错误,我都无法理解。我在几个不同的网站上试图解释,但仍然无法弄清楚如何做到这一点。
我的问题: 1.为什么我的解决方案不起作用?它们似乎遵循我在R网站上看到的语法? 2.达到我想要的输出的正确方法是什么?
risk <- c('VERY HIGH', 'VERY HIGH', 'HIGH', 'HIGH', 'MEDIUM', 'MEDIUM', 'LOW', 'LOW', 'LOW', 'LOW')
answer <- c('Y','Y','Y','Y','Y','Y','Y','Y','Y', 'N')
want <- data.frame(metricx, risk, answer)
答案 0 :(得分:2)
我认为使用dplyr
这就是你想要的,对吗?
library(dplyr)
df <- df %>% mutate(risk = cut(metricx, c(0, 2, 3.5, 4.5, 6),
labels = c("LOW", "MEDIUM", "HIGH", "VERY HIGH"))) %>%
mutate(answer = ifelse(metricx < .4, "N", "Y"))
答案 1 :(得分:1)
根据定义,你总会得到一个答案,这就是我离开df $ answer的原因。试试:
metricx <- c(5, 4.8, 4.4, 3.6, 3.2, 2.1, 1.9, .5, .3, .1)
df <- as.data.frame(metricx)
myif<-function(x) {
if (x<2) y="LOW" else
if (x<3.5) y="MEDIUM" else
if (x<4.5) y="HIGH" else y="VERY HIGH"
return(y)
}
sapply(df$metricx,myif)
# or:
ifelse(df[1]<2,"LOW",
ifelse(df[1]<3.5,"MEDIUM",
ifelse(df[1]<4.5,"HIGH","VERY HIGH")))
# or (modified later):
myif<-function(x) {
if (x<2) y="LOW" else
if (x<3.5) y="MEDIUM" else
if (x<4.5) y="HIGH" else y="VERY HIGH"
yv<-c(y,if (x<0.4) "N" else "Y" )
return(yv)
}
sapply(df$metricx,myif)