Question

我对我的数据集中的过滤有疑问。我的数据集如下所示：

      PROJECT       FREQ
1       <NA>         NA
2       <NA>         NA
3       FSHD 0.01282051
4       <NA>         NA
5       <NA>         NA
6  GROEI,CMS 0.02564103
7       <NA>         NA
8      GROEI 0.00000132
9       <NA>         NA
10  NMD,BRCA 0.03846154

这是我的问题：我想丢弃PROJECT字段中没有的所有行：GROEI和FREQ字段：大于0.01。

我想过这样的事情，但这不是那种方式......

a1<-a[!(a$PROJECT != "GROEI" & a$FREQINHDB >= 0.02),]

任何人都可以帮我吗？

谢谢！

Answer 1

由于您希望匹配部分字符串，因此您可以使用grepl将正则表达式与数据匹配：

na.omit(a[!grepl("GROEI", a$PROJECT), ])
    n  PROJECT       FREQ
3   3     FSHD 0.01282051
10 10 NMD,BRCA 0.03846154

R在多个条件下丢弃行

1 个答案: