没有“主表”的模糊匹配

时间:2018-09-04 16:35:16

标签: r fuzzy-logic stringdist

是否可以在没有所需结果表的情况下执行某种类型的模糊匹配?

例如,标准化以下行:

Lord Philip Harris
Lord Harris of Peckham
Lord Philip C. Harris
Philip Lord C Harris
Lord Phillip Harris of Peckham

进入第一个值,最后一个值或类似“ Philip Harris”的东西-其实并不重要。

我使用R中的stringdist包将一列附加到包含距测试的最小距离值的数据帧中,但为此,我有一个“正确”数据列表。

谢谢

0 个答案:

没有答案