通过R中的一个列名合并数据集时,如何删除重复的列名?

时间:2018-07-19 17:27:31

标签: r

通过一个列名称合并两个数据集:

mergeAll <-merge(dataset1,dataset2,by =“ houseID”)

此代码将把所有变量保留在两个数据集中,如果存在重复的变量名,例如,dataset1和dataset2都具有“ ID”,则mergeAll将具有ID.x(用于dataset1中的ID)和ID。 y(用于数据集2中的ID)。如何删除重复的变量名?我们只想保留一个ID,因为两个数据集中的ID相同?或者,如果它们的值不同,我们只想将ID变量保留在第一个数据集(即dataset1)中。

1 个答案:

答案 0 :(得分:0)

您无法将其删除(例如ID.x),并将“ ID.y”重命名为更有意义的名称,例如“ ID”:

require(dplyr)
mergeAll <- merge(dataset1, dataset2, by="houseID") %>%
                  select(-ID.x) %>% 
                  rename(c("ID"="ID.y"))