如何基于部分匹配R中的列提取重复项?

时间:2018-09-21 01:01:25

标签: r duplicates

我有这张桌子:

Names (first, last)   DOB
John Doe           09-18-1992
John Doe R         09-18-1992
Mark Guy           03-18-1959
Mark Guy Jr        03-18-1959
James Wu           06-17-1961

如何通过在DOB列中部分匹配姓氏和名字来提取重复的名字?

下面的dplyr代码无法将John和Mark识别为重复的个体。

dataframe %>%
               group_by(Names, DOB) %>%
               filter(n()>1)

0 个答案:

没有答案