Question

 a=c("A","A,B","C","B,C")
 b=c(1,2,3,4)
 dat<-data.frame(a,b)

 c=c("A","B","D","A")
 d=c(5,6,7,8)
 g<-data.frame(c,d)

我想比较dat和g。如果dat列a中的元素与g中列c的元素匹配，则应将g中列d的匹配条目添加到dat。

dat$NEW =""
sapply(strsplit(as.character(dat$a), ","),function(x){tmp=grep(x,g$c);dat$NEW=x)

我该怎么做：

g[grep("A",g$c),]
  c d
1 A 5
4 A 8

dat $ NEW中的条目应该看起来像“5,8”？

Answer 1

这适用于您的数据吗？

find.match <- g$c %in% dat$a
g[find.match, ]
  c d
1 A 5
4 A 8

Answer 2

目前还不完全清楚，但我认为你描述的是这个：

第1步：合并data.frame g中的重复元素

> gc <- sapply(split(g$d, g$c), paste, collapse=",")
> gc
    A     B     D 
"5,8"   "6"   "7"

第2步：将其与您的data.frame dat相结合

cbind(dat, 
    new=sapply(
        dat$a, 
        function(x)paste(
              gc[match(strsplit(as.character(x), ",")[[1]], g$c)], 
              collapse=",")
    )
)

结果：

    a b   new
1   A 1   5,8
2 A,B 2 5,8,6
3   C 3    NA
4 B,C 4  6,NA

按行应用strsplit并向数据添加列

2 个答案: