所以我想从我的数据中删除具有相同“id”的行(在这种情况下它是221和341) 如您所见,其他列中的值不同,所以我想删除重复的行(相同的ID),但我仍然希望保留其中一行。
>head(data)
id Sequence Score variable value
221 AAIYKLLKSHF 30.87 BiotinControl1_2 221498.368
341 EKPLFLVFHGT 42.04 BiotinControl1_2 255198.8712
330 FMIAPTGAKTF 49.67 BiotinControl1_2 1526577.651
221 FMIAPTGAKTF 40.69 BiotinControl2 429384.4861
341 GKLKGVLGYTE 39.34 BiotinTreatment1 597884.8329
196 IKKVVKAAAE 39.81 BiotinControl1_2 2277435.528
117 IKKVVKAAAE 44.86 BiotinControl1_2 1050394.325
这就是我的数据应该如何:
id Sequence Score variable value
221 AAIYKLLKSHF 30.87 BiotinControl1_2 221498.368
341 EKPLFLVFHGT 42.04 BiotinControl1_2 255198.8712
330 FMIAPTGAKTF 49.67 BiotinControl1_2 1526577.651
196 IKKVVKAAAE 39.81 BiotinControl1_2 2277435.528
117 IKKVVKAAAE 44.86 BiotinControl1_2 1050394.325
我应该使用哪种功能来做这样的事情?
答案 0 :(得分:0)
使用duplicated
dat[!duplicated(dat$id),]
id Sequence Score variable value
1 221 AAIYKLLKSHF 30.87 BiotinControl1_2 221498.4
2 341 EKPLFLVFHGT 42.04 BiotinControl1_2 255198.9
3 330 FMIAPTGAKTF 49.67 BiotinControl1_2 1526577.7
6 196 IKKVVKAAAE 39.81 BiotinControl1_2 2277435.5
7 117 IKKVVKAAAE 44.86 BiotinControl1_2 1050394.3