在R中的多个列中应用矢量化子集

时间:2016-01-15 22:10:27

标签: r vectorization subset logical-operators generalization

我试图找到一种直接的方法来矢量化/概括data.frame的子集化。我们假设我有一个data.frame:

$(".fc-event-container").remove()

每列都有自己的条件,目标是df的子集,因此只有那些行保留在至少一列满足条件的位置。我现在想找到一个推广

的向量化子集机制
df <- data.frame(A = 1:5, B = 10 * 1:5, C = 100 * 1:5)

所以我可以像这样制定它

df <- subset(df, df[,1]<2 | df[,2]< 30 | df[,3]<100)

在我想去的路上。

crit <- c(2,30,100)
df <- subset(df, df$header < crit[1:3])

我知道一个多步循环解决方法,但必须有另一种方法。我很感激任何帮助。

2 个答案:

答案 0 :(得分:4)

假设:

x <- c(1:5)
y <- c(10,20,30,40,50)
z <- c(100,200,300,400,500)

# df is a base function
mydf <- data.frame(A = x, B = y, C = z)

crit <- c(2,30,100)

然后,这将让您看到列中的哪些值小于暴击值:

> sweep(mydf, 2, crit, "<")
         A     B     C
[1,]  TRUE  TRUE FALSE
[2,] FALSE  TRUE FALSE
[3,] FALSE FALSE FALSE
[4,] FALSE FALSE FALSE
[5,] FALSE FALSE FALSE

这将为您提供符合任何条件的行:

> subset(mydf, rowSums(sweep(mydf, 2, crit, "<")) > 0)

  A  B   C
1 1 10 100
2 2 20 200

答案 1 :(得分:1)

这也应该有用

> df[apply(df, 1, function(x){any(x < crit)}), ]
  A  B   C
1 1 10 100
2 2 20 200