a=c("A","A,B","C","B,C")
b=c(1,2,3,4)
dat<-data.frame(a,b)
c=c("A","B","D","A")
d=c(5,6,7,8)
g<-data.frame(c,d)
我想比较dat和g。如果dat列a中的元素与g中列c的元素匹配,则应将g中列d的匹配条目添加到dat。
dat$NEW =""
sapply(strsplit(as.character(dat$a), ","),function(x){tmp=grep(x,g$c);dat$NEW=x)
我该怎么做:
g[grep("A",g$c),]
c d
1 A 5
4 A 8
dat $ NEW中的条目应该看起来像“5,8”?
答案 0 :(得分:1)
这适用于您的数据吗?
find.match <- g$c %in% dat$a
g[find.match, ]
c d
1 A 5
4 A 8
答案 1 :(得分:0)
目前还不完全清楚,但我认为你描述的是这个:
第1步:合并data.frame g中的重复元素
> gc <- sapply(split(g$d, g$c), paste, collapse=",")
> gc
A B D
"5,8" "6" "7"
第2步:将其与您的data.frame dat相结合
cbind(dat,
new=sapply(
dat$a,
function(x)paste(
gc[match(strsplit(as.character(x), ",")[[1]], g$c)],
collapse=",")
)
)
结果:
a b new
1 A 1 5,8
2 A,B 2 5,8,6
3 C 3 NA
4 B,C 4 6,NA