当列包含因子时,使用OR子集数据帧

时间:2011-04-15 18:24:06

标签: r logical-operators

我想在R中创建一个数据框的子集,该子集基于一列因子中的一个或另一个值,但似乎我不能将|用于因子值。

示例:

# fake data
x <- sample(1:100, 9)
nm <- c("a", "a", "a", "b", "b", "b", "c", "c", "c")
fake <- cbind(as.data.frame(nm), as.data.frame(x))
# subset fake to only rows with name equal to a or b
fake.trunk <- fake[fake$nm == "a" | "b", ]

产生错误:

Error in fake$nm == "a" | "b" : 
operations are possible only for numeric, logical or complex types

我怎样才能做到这一点?

显然,我的实际数据框在因子列中有超过3个值,因此仅使用!= "c"将不起作用。

2 个答案:

答案 0 :(得分:26)

您需要fake.trunk <- fake[fake$nm == "a" | fake$nm == "b", ]。更简洁的写作方式(特别是有两个以上的条件)是:

fake[ fake$nm %in% c("a","b"), ]

答案 1 :(得分:13)

另一种方法是使用subset()并编写

fake.trunk = subset(fake, nm %in% c('a', 'b'))