我有一个很长的列(excel中有9500行),我有很多基因ID。我想删除重复项。
ID
BXDC2
BXDC5
BXDC5
BZRPL1
BZRPL1
C10orf11
C10orf116
C10orf119
C10orf120
C10orf125
C10orf125
我希望结果是:
ID
BXDC2
BXDC5
BZRPL1
C10orf11
C10orf116
C10orf119
C10orf120
C10orf125
任何人都可以用R脚本帮助我: - )?
答案 0 :(得分:4)
您可以使用duplicated
或unique
。在这里,我假设列名是' ID'
df1[!duplicated(df1$ID),,drop=FALSE]
或者
library(data.table)#v1.9.4+
unique(setDT(df1), by='ID')