Question

我有一个问题是合并两个不同长度的数据集 - 下面是一些例子

DF1：

A B C D  E  F
1 1 1 10 20 3
1 1 1 10 20 2
1 1 1 15 10 1
1 1 1 20 15 3
1 2 1 10 20 3
1 2 1 15 10 3
2 1 1 20 20 3
2 1 1 30 10 1
2 2 1 50 10 2

DF2：

A B C X  Y  Z
1 1 1 10 10 1
1 2 1 20 20 2
2 1 1 10 20 1
2 2 1 20 20 2

我需要创建一个新的数据框，我将df2$X和df2$Y合并到每个分组变量（A和B）的df1中。

我尝试了以下内容：

df3 <- merge(df2, df1, all.y = TRUE)

这与df3$X和df3$Y有关，但df3$D和df3$E的排序略有错误。

您是否有任何建议可以确保这些变量的排序正确，因为它们首次出现在df1中？

Answer 1

使用合并时，使用以下

指定密钥可能是个好主意

df3 <- merge(df2, df1, by="your key", all.y=T)

但正如所说，一个可重复的例子会有所帮助