我有两个比赛结果数据集,每个数据集都有变量" Name"," School"和" Points。"
我想将这两个数据集合并到R中,通过" Name"和#34;学校",因为有些学生参加了两个比赛。然而,有时学校拼写不同于锦标赛到锦标赛,所以我需要合并来覆盖不同的拼写(默认为第一次拼写)。
关于如何做到这一点的想法?谢谢!
答案 0 :(得分:0)
如果你可以为这样的学校收集所有可能的拼写错误:
data.frame(
possible_spelling = c("a school", "a skool", "b schol", "b skol"),
actual_spelling = c("a school", "a school", "b school", "b school")
)
然后您可以将其合并到两个数据集中,然后通过actual_spelling
加入如果您想生成可能的学校拼写列表,请执行此操作:
library(dplyr)
dataset_1 %>% select(school) %>%
bind_rows(dataset_2 %>% select(school) %>%
distinct %>%
arrange(school) %>%
write.csv(row.names = FALSE)