R使用两个条件和模糊合并合并数据集

时间:2020-01-08 14:46:51

标签: r merge conditional-statements fuzzyjoin

我正在尝试使用两个条件和模糊合并来合并R中的两个数据集。

数据集1: 在这里,几个城市可以使用相同的邮政编码,并且城市名称的书写方式不统一

Zip_code         Name   
33126            ST MAGNE
44000            Nantes
33126            La rivière
33124            LADOS
33126            Saint Aignan
33140            Villenave d'ornon

数据集2: 在这里,每个城市都匹配一个唯一的邮政编码,并且所有名称都被统一写上

Zip_code         Name               Unique_zipcode
33126            SAINT MAGNE        33436
44000            NANTES             44109
33126            LA RIVIERE         33356
33124            LADOS              33216
33126            SAINT AIGNAN       33365
33140            VILLENAVE D ORNON  33550

因此,我希望每个城市都可以使用唯一的邮政编码进行匹配,

  1. 在我的初始数据集中,邮政编码可以与多个城市匹配,所以我不能使用 df_final<-merge(df1,df2, by="Zip_code")

  2. 两个数据集中的城市名称写得并不完全相同,因此我在尝试时丢失了很多行 df_final<-merge(df1,df2, by=c("Zip_code","Name"))

我尝试使用功能agrep,但是我不知道如何将其与其他条件结合使用。

任何帮助将不胜感激!

0 个答案:

没有答案