我有一个问题是合并两个不同长度的数据集 - 下面是一些例子
DF1:
A B C D E F
1 1 1 10 20 3
1 1 1 10 20 2
1 1 1 15 10 1
1 1 1 20 15 3
1 2 1 10 20 3
1 2 1 15 10 3
2 1 1 20 20 3
2 1 1 30 10 1
2 2 1 50 10 2
DF2:
A B C X Y Z
1 1 1 10 10 1
1 2 1 20 20 2
2 1 1 10 20 1
2 2 1 20 20 2
我需要创建一个新的数据框,我将df2$X
和df2$Y
合并到每个分组变量(A和B)的df1中。
我尝试了以下内容:
df3 <- merge(df2, df1, all.y = TRUE)
这与df3$X
和df3$Y
有关,但df3$D
和df3$E
的排序略有错误。
您是否有任何建议可以确保这些变量的排序正确,因为它们首次出现在df1中?
答案 0 :(得分:2)
使用合并时,使用以下
指定密钥可能是个好主意df3 <- merge(df2, df1, by="your key", all.y=T)
但正如所说,一个可重复的例子会有所帮助