按行应用strsplit并向数据添加列

时间:2011-08-25 08:29:12

标签: function r loops split

 a=c("A","A,B","C","B,C")
 b=c(1,2,3,4)
 dat<-data.frame(a,b)

 c=c("A","B","D","A")
 d=c(5,6,7,8)
 g<-data.frame(c,d)

我想比较dat和g。如果dat列a中的元素与g中列c的元素匹配,则应将g中列d的匹配条目添加到dat。

dat$NEW =""
sapply(strsplit(as.character(dat$a), ","),function(x){tmp=grep(x,g$c);dat$NEW=x)

我该怎么做:

g[grep("A",g$c),]
  c d
1 A 5
4 A 8

dat $ NEW中的条目应该看起来像“5,8”?

2 个答案:

答案 0 :(得分:1)

这适用于您的数据吗?

find.match <- g$c %in% dat$a
g[find.match, ]
  c d
1 A 5
4 A 8

答案 1 :(得分:0)

目前还不完全清楚,但我认为你描述的是这个:

第1步:合并data.frame g中的重复元素

> gc <- sapply(split(g$d, g$c), paste, collapse=",")
> gc
    A     B     D 
"5,8"   "6"   "7" 

第2步:将其与您的data.frame dat相结合

cbind(dat, 
    new=sapply(
        dat$a, 
        function(x)paste(
              gc[match(strsplit(as.character(x), ",")[[1]], g$c)], 
              collapse=",")
    )
)

结果:

    a b   new
1   A 1   5,8
2 A,B 2 5,8,6
3   C 3    NA
4 B,C 4  6,NA