Question

以下是示例数据：

set.seed(123)
data1 <- data.frame(id1=rep(1:5,each=2),nam1=rnorm(5,1))
data2 <- data.frame(id2=rep(3:12,each=2),nam2=rexp(10,1))

这个合并（以及我所知道的扩展）给出了：

merge(data1,data2, by.x="id1",by.y="id2")

    id1      nam1      nam2
1    3  2.3152036 2.5419696
2    3  2.3152036 4.8606998
3    3  0.6713674 2.5419696
4    3  0.6713674 4.8606998
5    4  1.4768687 0.6174029
6    4  1.4768687 0.2536772
7    4  2.7471229 0.6174029
8    4  2.7471229 0.2536772
9    5 -0.3507662 2.6098995
10   5 -0.3507662 0.6313073
11   5  2.3152036 2.6098995
12   5  2.3152036 0.6313073

因此它提供了data1和data2的所有行！同一个id的双行。

我想得到的是：

    id1 nam2        nam2
1    1  0.4395244   NA
2    1  0.7698225   NA
3    2  2.5587083   NA
4    2  1.0705084   NA
5    3  1.1292877   0.31422729
6    3  0.4395244   0.14526680
7    4  0.7698225   2.72623646
8    4  2.5587083   0.02915345
9    5  1.0705084   1.00483006
10   5  1.1292877   0.48021473

所以我想只得到data1和correspod的条目。 data2匹配

Answer 1

感谢@ Vincent Guillemot的建议，解决了我真正需要的东西！

set.seed(123)
data1 <- data.frame(id1=rep(1:5,each=2),nam1=rnorm(5,1))
data2 <- data.frame(id2=rep(3:12,each=2),nam2=rexp(10,1))

data1$id1 <- make.unique(as.character(data1$id1))
data2$id2 <- make.unique(as.character(data2$id2))

merge(data1,data2, by.x="id1",by.y="id2",all.x=TRUE)

合并R中的唯一值

1 个答案: