以下是示例数据:
set.seed(123)
data1 <- data.frame(id1=rep(1:5,each=2),nam1=rnorm(5,1))
data2 <- data.frame(id2=rep(3:12,each=2),nam2=rexp(10,1))
这个合并(以及我所知道的扩展)给出了:
merge(data1,data2, by.x="id1",by.y="id2")
id1 nam1 nam2
1 3 2.3152036 2.5419696
2 3 2.3152036 4.8606998
3 3 0.6713674 2.5419696
4 3 0.6713674 4.8606998
5 4 1.4768687 0.6174029
6 4 1.4768687 0.2536772
7 4 2.7471229 0.6174029
8 4 2.7471229 0.2536772
9 5 -0.3507662 2.6098995
10 5 -0.3507662 0.6313073
11 5 2.3152036 2.6098995
12 5 2.3152036 0.6313073
因此它提供了data1和data2的所有行!同一个id的双行。
我想得到的是:
id1 nam2 nam2
1 1 0.4395244 NA
2 1 0.7698225 NA
3 2 2.5587083 NA
4 2 1.0705084 NA
5 3 1.1292877 0.31422729
6 3 0.4395244 0.14526680
7 4 0.7698225 2.72623646
8 4 2.5587083 0.02915345
9 5 1.0705084 1.00483006
10 5 1.1292877 0.48021473
所以我想只得到data1和correspod的条目。 data2匹配
答案 0 :(得分:3)
感谢@ Vincent Guillemot的建议,解决了我真正需要的东西!
set.seed(123)
data1 <- data.frame(id1=rep(1:5,each=2),nam1=rnorm(5,1))
data2 <- data.frame(id2=rep(3:12,each=2),nam2=rexp(10,1))
data1$id1 <- make.unique(as.character(data1$id1))
data2$id2 <- make.unique(as.character(data2$id2))
merge(data1,data2, by.x="id1",by.y="id2",all.x=TRUE)