在R中使用覆盖合并两个变量的数据

时间:2015-11-15 02:07:38

标签: r merge

我有两个比赛结果数据集,每个数据集都有变量" Name"," School"和" Points。"

我想将这两个数据集合并到R中,通过" Name"和#34;学校",因为有些学生参加了两个比赛。然而,有时学校拼写不同于锦标赛到锦标赛,所以我需要合并来覆盖不同的拼写(默认为第一次拼写)。

关于如何做到这一点的想法?谢谢!

1 个答案:

答案 0 :(得分:0)

如果你可以为这样的学校收集所有可能的拼写错误:

data.frame(
  possible_spelling = c("a school", "a skool", "b schol", "b skol"),
  actual_spelling = c("a school", "a school", "b school", "b school")
)

然后您可以将其合并到两个数据集中,然后通过actual_spelling

加入

如果您想生成可能的学校拼写列表,请执行此操作:

library(dplyr)
dataset_1 %>% select(school) %>%
  bind_rows(dataset_2 %>% select(school) %>%
  distinct %>%
  arrange(school) %>%
  write.csv(row.names = FALSE)