我想删除重复的行:第一列C1可以重复,但如果所有其他列与C2 = C3 = C4 = C5相同,我只需要保留一个副本:
示例:
C1 C2 C3 C4 C5
7163003 17/09/2008 GE A 45
7163003 17/09/2008 GE A 45
7163003 08/06/2009 GE B 50
7163003 22/12/2011 GE C 45
结果:
C1 C2 C3 C4 C5
7163003 17/09/2008 GE A 45
7163003 08/06/2009 GE B 50
7163003 22/12/2011 GE C 45
答案 0 :(得分:2)
mydata<-data.frame(C1=c(LETTERS,LETTERS),C2=c(LETTERS,LETTERS),C3=c(LETTERS,LETTERS),C4=c(LETTERS,LETTERS),C5=c(LETTERS,LETTERS))
mydata
mydata[!duplicated(mydata$C1),]
答案 1 :(得分:0)
dplyr
解决方案使用distinct
:
library(dplyr)
distinct(df)
C1 C2 C3 C4 C5
1 7163003 17/09/2008 GE A 45
2 7163003 08/06/2009 GE B 50
3 7163003 22/12/2011 GE C 45