Question

我正在开展一个项目，通过在两个表之间的相关列中实现相同的变量，使我公司的一些数据库更具关系性。我的示例数据看起来像这样（我的实际数据有更多值）：

A               B
Farm Date   FARM DATE
Dog Numbers DOG NUM
Cat Numbers CAT NUM
Pig Count   PIG CNT
Cow Numbers COW NUM
Grass       GRASS
Hay         HAY 
Feed        FEED
Corn        CORN
Crops       CROPS
Price       WEEK
Time        MONTH
Date        FARMER
            PEANUTS
            VEGGIES
            BARN TYPE

因此，B列包含的项目多于A列，这很好。我不是要试图匹配常见项目。我正在尝试生成一个列，其中包含所有常用项以及两列中不常见的项。

可以使用tidyr来完成此任务吗？任何帮助实现这一点是值得赞赏的！

希望结果：

C
Farm Date   
Dog Numbers 
Cat Numbers 
Pig Count   
Cow Numbers 
Grass      
Hay      
Feed      
Corn        
Crops       
Price    
Time   
Date    
Farmer
Peanuts
Veggies
Barn Type

Answer 1

您可以使用union功能。例如：

A<-c("a", "b", "c", "d", "e")
B<-c("d", "b", "e", "f", "g")

union(A, B)
# [1] "a" "b" "c" "d" "e" "f" "g"

为了使字符串具有可比性，您可以在应用tolower()之前使用union。

两个具有相似但不同列元素的表 - 希望合并

1 个答案: