我正在尝试使用两个条件和模糊合并来合并R中的两个数据集。
数据集1: 在这里,几个城市可以使用相同的邮政编码,并且城市名称的书写方式不统一
Zip_code Name
33126 ST MAGNE
44000 Nantes
33126 La rivière
33124 LADOS
33126 Saint Aignan
33140 Villenave d'ornon
数据集2: 在这里,每个城市都匹配一个唯一的邮政编码,并且所有名称都被统一写上
Zip_code Name Unique_zipcode
33126 SAINT MAGNE 33436
44000 NANTES 44109
33126 LA RIVIERE 33356
33124 LADOS 33216
33126 SAINT AIGNAN 33365
33140 VILLENAVE D ORNON 33550
因此,我希望每个城市都可以使用唯一的邮政编码进行匹配,
在我的初始数据集中,邮政编码可以与多个城市匹配,所以我不能使用
df_final<-merge(df1,df2, by="Zip_code")
两个数据集中的城市名称写得并不完全相同,因此我在尝试时丢失了很多行
df_final<-merge(df1,df2, by=c("Zip_code","Name"))
我尝试使用功能agrep
,但是我不知道如何将其与其他条件结合使用。
任何帮助将不胜感激!