使用R匹配两个数据帧的公共列中的值,然后跨相应的数据

时间:2018-04-23 10:50:43

标签: r matching

我有两个数据帧。

第一个(df1)有一列记录每行的旧ID号和一列具有相应的新ID号。这是一个更大的数据集。

第二个(df2)的列只有每行的旧ID号。我想在第二个数据框中创建一个新列,其中包含在df1中找到的相应新ID号。

以下是数据集的虚拟示例:

DF1

OldID     NewID Numofsh Loc
ID10000   4853  158     Bath
ID10001   5091  43      York
ID10002   5205  12      Cambridge
ID10003   4897  6       London
ID10004   6488  8       Edinburgh

DF2

OldID    CPH
ID10004  77/567/4433
ID10001  66/123/4567

和我想要的最终df2的虚拟示例

 OldID    CPH         NewID
ID10004  77/567/4433  6488
ID10001  66/123/4567  5091

2 个答案:

答案 0 :(得分:0)

match用于子集df1并提取' NewID'的值。使用$

df2$NewID <- df1[match(df2$OldID, df1$OldID), ]$NewID
df2
#    OldID         CPH NewID
#1 ID10004 77/567/4433  6488
#2 ID10001 66/123/4567  5091

数据

df1 <- read.table(text = "OldID     NewID Numofsh Loc
ID10000   4853  158     Bath
ID10001   5091  43      York
ID10002   5205  12      Cambridge
ID10003   4897  6       London
ID10004   6488  8       Edinburgh", header = TRUE)

df2 <- read.table(text = "OldID    CPH
ID10004  77/567/4433
ID10001  66/123/4567", header = TRUE)

答案 1 :(得分:0)

使用dplyr::left_join()

library(dplyr)
df3 <- df2 %>%
  left_join(df1, by = 'OldID') %>%
  select(-c(Numofsh, Loc))

哪个收益

    OldID         CPH NewID
1 ID10004 77/567/4433  6488
2 ID10001 66/123/4567  5091