从列R中删除重复项

时间:2015-07-11 11:17:26

标签: r duplicate-removal row-removal

我有一个很长的列(excel中有9500行),我有很多基因ID。我想删除重复项。

ID
BXDC2                     
BXDC5                   
BXDC5                     
BZRPL1                    
BZRPL1                                       
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125          
C10orf125       

我希望结果是:

ID
BXDC2                     
BXDC5                                      
BZRPL1                    
C10orf11         
C10orf116                                 
C10orf119              
C10orf120    
C10orf125         

任何人都可以用R脚本帮助我: - )?

1 个答案:

答案 0 :(得分:4)

您可以使用duplicatedunique。在这里,我假设列名是' ID'

 df1[!duplicated(df1$ID),,drop=FALSE]

或者

  library(data.table)#v1.9.4+
  unique(setDT(df1), by='ID')