模糊字符串与group_by匹配

时间:2018-06-15 10:11:26

标签: r group-by fuzzy fuzzy-comparison

我必须确定并非总是使用相同的NAME组合转移的付款 - IBAN。

我们说我有一张名为"付款"看起来像这样:

IBAN       NAME
ABCD       James Dito
ABCD       James D.
ABCD       J Dito
ABCD       Peter Oliver
EDFG       Ana Pirez
EDFG       ANA P.

我想要确定的是iban" ABCD"通常对应于James Dito(或其模糊匹配),但是一笔付款转移到了iban" ABCD"完全不同的名字:彼得奥利弗。

我的想法是在每个IBAN组内进行模糊匹配的group_by,但我不知道该怎么做。

因此,理想的输出应如下所示:

IBAN       NAME
ABCD       James Dito
ABCD       Peter Oliver
EDFG       Ana Pirez

非常感谢任何帮助。

0 个答案:

没有答案