假设我们有一个数据框
x y
1 1
2 4
4 5
如何向数据框添加一个新变量,使得如果x小于或等于1,则返回“good”,如果x介于3和5之间,则返回“bad”,否则返回“fair”
x y w
1 1 "good"
2 2 "fair"
5 5 "bad"
应用了ocram所示的方法,但是这里的方法不起作用。
d1 <- c("e", "c", "a")
d2 <- c("e", "a", "b")
w <- ifelse(d1 == "e" & (d2=="e"), 1, ifelse((d1 == "a") & (d2 =="b"), 2, ifelse(d1 == "e"),3,99))
有什么想法吗? 感谢
答案 0 :(得分:20)
一个明显而直接的可能性是使用“if-else条件”。在那个例子中
x <- c(1, 2, 4)
y <- c(1, 4, 5)
w <- ifelse(x <= 1, "good", ifelse((x >= 3) & (x <= 5), "bad", "fair"))
data.frame(x, y, w)
**对于编辑中的其他问题** 那是你的期望吗?
> d1 <- c("e", "c", "a")
> d2 <- c("e", "a", "b")
>
> w <- ifelse((d1 == "e") & (d2 == "e"), 1,
+ ifelse((d1=="a") & (d2 == "b"), 2,
+ ifelse((d1 == "e"), 3, 99)))
>
> data.frame(d1, d2, w)
d1 d2 w
1 e e 1
2 c a 99
3 a b 2
如果您对ifelse
功能感到不舒服,您还可以使用if
和else
语句来处理此类应用。
答案 1 :(得分:3)
如果级别数量非常有限,您可以尝试将y
转换为系数并更改其级别。
> xy <- data.frame(x = c(1, 2, 4), y = c(1, 4, 5))
> xy$w <- as.factor(xy$y)
> levels(xy$w) <- c("good", "fair", "bad")
> xy
x y w
1 1 1 good
2 2 4 fair
3 4 5 bad