做了一些研究,但无法找到我的简单问题的直接答案。 我有一个这样的数据表:
var1<-sample(12:43,5,replace=T)
var2<-sample(5:20,5,replace=T)
var3<-rep(0, 5)
var4<-sample(2:6,5,replace=T)
var5<-rep(0,5)
df<-data.table(var1,var2,var3,var4,var5)
var1 var2 var3 var4 var5
1: 36 14 0 2 0
2: 43 19 0 6 0
3: 20 6 0 6 0
4: 41 17 0 2 0
5: 32 8 0 6 0
我想删除只包含0个值的所有列。 这将生成一个逻辑向量。
a<-df[,(df[20,]) != 0]
如何使用逻辑矢量对数据进行子集化?
答案 0 :(得分:1)
使用dplyr
var1<-sample(12:43,5,replace=T)
var2<-sample(5:20,5,replace=T)
var3<-rep(0, 5)
var4<-sample(2:6,5,replace=T)
var5<-rep(0,5)
df<-data.frame(var1,var2,var3,var4,var5)
library(dplyr)
# keep only columns for which all line are different from 0
df %>% select_if(function(col) !all(col == 0))
#> var1 var2 var4
#> 1 13 20 4
#> 2 39 19 6
#> 3 14 20 2
#> 4 35 13 3
#> 5 35 17 4
答案 1 :(得分:0)
如果我们需要data.table方法,循环遍历data.table(lapply(.SD
)的子集,检查all
值是否为0,unlist
输出,否定( !
)并根据逻辑索引对列进行子集化。
df[, df[, !unlist(lapply(.SD, function(x) all(x==0)))], with = FALSE]
或者使用base R
,我们可以Filter
var
或sum
不为0的列。
Filter(var, df)