如何根据条件在data.frame中创建新变量?

时间:2011-04-19 08:50:54

标签: r dataframe

假设我们有一个数据框

x   y
1   1
2   4 
4   5 

如何向数据框添加一个新变量,使得如果x小于或等于1,则返回“good”,如果x介于3和5之间,则返回“bad”,否则返回“fair”

x   y  w
1   1  "good"
2   2   "fair"
5   5   "bad"

应用了ocram所示的方法,但是这里的方法不起作用。

d1 <- c("e", "c", "a")
d2 <- c("e", "a", "b")

w <- ifelse(d1 == "e" & (d2=="e"), 1, ifelse((d1 == "a") & (d2 =="b"), 2, ifelse(d1 == "e"),3,99))

有什么想法吗? 感谢

2 个答案:

答案 0 :(得分:20)

一个明显而直接的可能性是使用“if-else条件”。在那个例子中

x <- c(1, 2, 4)
y <- c(1, 4, 5)
w <- ifelse(x <= 1, "good", ifelse((x >= 3) & (x <= 5), "bad", "fair"))
data.frame(x, y, w)

**对于编辑中的其他问题** 那是你的期望吗?

> d1 <- c("e", "c", "a")
> d2 <- c("e", "a", "b")
> 
> w <- ifelse((d1 == "e") & (d2 == "e"), 1, 
+    ifelse((d1=="a") & (d2 == "b"), 2,
+    ifelse((d1 == "e"), 3, 99)))
>     
> data.frame(d1, d2, w)
  d1 d2  w
1  e  e  1
2  c  a 99
3  a  b  2

如果您对ifelse功能感到不舒服,您还可以使用ifelse语句来处理此类应用。

答案 1 :(得分:3)

如果级别数量非常有限,您可以尝试将y转换为系数并更改其级别。

> xy <- data.frame(x = c(1, 2, 4), y = c(1, 4, 5))
> xy$w <- as.factor(xy$y)
> levels(xy$w) <- c("good", "fair", "bad")
> xy
  x y    w
1 1 1 good
2 2 4 fair
3 4 5  bad