mergeAll <-merge(dataset1,dataset2,by =“ houseID”)
此代码将把所有变量保留在两个数据集中,如果存在重复的变量名,例如,dataset1和dataset2都具有“ ID”,则mergeAll将具有ID.x(用于dataset1中的ID)和ID。 y(用于数据集2中的ID)。如何删除重复的变量名?我们只想保留一个ID,因为两个数据集中的ID相同?或者,如果它们的值不同,我们只想将ID变量保留在第一个数据集(即dataset1)中。
答案 0 :(得分:0)
您无法将其删除(例如ID.x),并将“ ID.y”重命名为更有意义的名称,例如“ ID”:
require(dplyr)
mergeAll <- merge(dataset1, dataset2, by="houseID") %>%
select(-ID.x) %>%
rename(c("ID"="ID.y"))