比较两组内数据的出现

时间:2018-06-29 14:46:26

标签: r grouping repeat find-occurrences

我有一个带有用户名和组的数据。

User_Name    Group
MustafE       A
fischeta      A
LosperS1      A
MustafE       B    
fischeta      B  
jose          B  
MustafE       c   
fischeta      c 

我要标记那些不重复分组的客户。示例-'LosperS1'在A组中,但不在B组中,'jose'在B组中,但不在C组中,所以在一个新的列,它们将被标记为“ B组否/ C组否”

任何帮助将不胜感激..

1 个答案:

答案 0 :(得分:1)

这是使用tidyverse获取输出的一种方法。获取“ User_Name”列中的distinct个元素,根据“ User_Name”中是否存在循环元素,map遍历这些元素(filter),paste数据集的行,{{ 1}}与过滤后的“组”相比,在“组”列中找不到的元素,将第一行(slice)和right_join包含在原始数据集中。我们使用map_df将最终输出作为单个data.frame而不是list的{​​{1}}

data.frame