我正在开展一个项目,通过在两个表之间的相关列中实现相同的变量,使我公司的一些数据库更具关系性。我的示例数据看起来像这样(我的实际数据有更多值):
A B
Farm Date FARM DATE
Dog Numbers DOG NUM
Cat Numbers CAT NUM
Pig Count PIG CNT
Cow Numbers COW NUM
Grass GRASS
Hay HAY
Feed FEED
Corn CORN
Crops CROPS
Price WEEK
Time MONTH
Date FARMER
PEANUTS
VEGGIES
BARN TYPE
因此,B列包含的项目多于A列,这很好。我不是要试图匹配常见项目。我正在尝试生成一个列,其中包含所有常用项以及两列中不常见的项。
可以使用tidyr
来完成此任务吗?任何帮助实现这一点是值得赞赏的!
希望结果:
C
Farm Date
Dog Numbers
Cat Numbers
Pig Count
Cow Numbers
Grass
Hay
Feed
Corn
Crops
Price
Time
Date
Farmer
Peanuts
Veggies
Barn Type
答案 0 :(得分:2)
您可以使用union
功能。
例如:
A<-c("a", "b", "c", "d", "e")
B<-c("d", "b", "e", "f", "g")
union(A, B)
# [1] "a" "b" "c" "d" "e" "f" "g"
为了使字符串具有可比性,您可以在应用tolower()
之前使用union
。