通过一个列名称合并两个数据集：

Question

通过一个列名称合并两个数据集：

mergeAll <-merge（dataset1，dataset2，by =“ houseID”）

此代码将把所有变量保留在两个数据集中，如果存在重复的变量名，例如，dataset1和dataset2都具有“ ID”，则mergeAll将具有ID.x（用于dataset1中的ID）和ID。 y（用于数据集2中的ID）。如何删除重复的变量名？我们只想保留一个ID，因为两个数据集中的ID相同？或者，如果它们的值不同，我们只想将ID变量保留在第一个数据集（即dataset1）中。

Answer 1

您无法将其删除（例如ID.x），并将“ ID.y”重命名为更有意义的名称，例如“ ID”：

require(dplyr)
mergeAll <- merge(dataset1, dataset2, by="houseID") %>%
                  select(-ID.x) %>% 
                  rename(c("ID"="ID.y"))

通过R中的一个列名合并数据集时，如何删除重复的列名？

通过一个列名称合并两个数据集：

1 个答案: