如何根据R中的唯一值组合行?

时间:2015-05-14 10:58:03

标签: r aggregate

我是R的初学者。我是一个CSV文件,其数据如下,例如:

ID  Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP

我想删除ID中的重复项,并将其数据附加到Values列中,如下所示:

ID  Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG,DV,GTH,LYT
567 EDR,TYU,EOP,OMN,FGH,KIH,IOP

如何在R?

中实现这一目标

2 个答案:

答案 0 :(得分:2)

你可以尝试

library(data.table)
setDT(df1)[, list(Values=paste(Values, collapse=",")) ,ID]

或使用base R

 aggregate(.~ID, df1, paste, collapse=",")

答案 1 :(得分:2)

dat <- read.table(text="ID  Values
820 D1,D2,FE
730 D1,D2,D3,PC,Io,He,Bt,Te,AR,PG
730 DV,GTH,LYT
567 EDR,TYU,EOP,OMN
567 FGH,KIH,IOP", header=TRUE)

dat2 <- dat %>% group_by(ID) %>% summarise(val=paste(Values, collapse=","))