我对我的数据集中的过滤有疑问。我的数据集如下所示:
PROJECT FREQ
1 <NA> NA
2 <NA> NA
3 FSHD 0.01282051
4 <NA> NA
5 <NA> NA
6 GROEI,CMS 0.02564103
7 <NA> NA
8 GROEI 0.00000132
9 <NA> NA
10 NMD,BRCA 0.03846154
这是我的问题:我想丢弃PROJECT字段中没有的所有行:GROEI和FREQ字段:大于0.01。
我想过这样的事情,但这不是那种方式......
a1<-a[!(a$PROJECT != "GROEI" & a$FREQINHDB >= 0.02),]
任何人都可以帮我吗?
谢谢!
答案 0 :(得分:3)
由于您希望匹配部分字符串,因此您可以使用grepl
将正则表达式与数据匹配:
na.omit(a[!grepl("GROEI", a$PROJECT), ])
n PROJECT FREQ
3 3 FSHD 0.01282051
10 10 NMD,BRCA 0.03846154