基于列数阈值的子集数据帧

时间:2020-01-08 14:45:22

标签: r dataframe dplyr

我有一个这样的数据框:

Bacteria                  feature_id s_counts   s1   s2      s3   s4    s5   s6
s__Bacillus_thuringiensis c34ed8     4745       0    1300    12    0    190  230   
s__Bacillus_pumilus       d73583     333        333  0       0     0    0    0

我只想过滤并保留从s1列到ncol的至少4列中计数> 0的行,所以我可以得到它:

Bacteria                  feature_id s_counts   s1   s2      s3   s4    s5   s6
s__Bacillus_thuringiensis c34ed8     4745       0    1300    12    0    190  230

这与问题Subset data frame based on number of rows per group相似,除非我对列而不是行感兴趣,所以我无法弄清楚如何将解决方案“适应” cols。我看不到将数据分组的方法,因为我需要列而不是行。 有人可以帮我吗?另外,如果可能的话,我希望使用dplyr解决方案。

干杯

狮子座

0 个答案:

没有答案