在加入或合并之前在两个不同的数据帧列中查找不匹配的名称

时间:2016-06-10 18:03:19

标签: r dplyr tidyr stringr

我想知道在dplyr中进行连接之前是否有一种比较列的简单方法。以下是两个简单的数据帧。我想基于名字和姓氏加入,但是有一些拼写错误或不同的格式,例如“Elizabeth Ray”和“Elizabeth”。

我想在加入之前比较这些列。有没有办法使用匹配函数或设置操作,如交叉等,来查找两列中没有匹配项的名称?我只想要一个不同名称的列表,以便我可以在加入之前手动纠正它们。

我想要一个基于dplyr,tidyr和stringr的解决方案。

configure: error: cannot run /bin/sh ../../config.sub

0 个答案:

没有答案