是否可以在没有所需结果表的情况下执行某种类型的模糊匹配?
例如,标准化以下行:
Lord Philip Harris
Lord Harris of Peckham
Lord Philip C. Harris
Philip Lord C Harris
Lord Phillip Harris of Peckham
进入第一个值,最后一个值或类似“ Philip Harris”的东西-其实并不重要。
我使用R中的stringdist包将一列附加到包含距测试的最小距离值的数据帧中,但为此,我有一个“正确”数据列表。
谢谢