使用R在地址列表中查找相似的地址

时间:2019-02-13 04:45:19

标签: r

我有一个数据库中的学校名称列表,由于没有验证检查,我们最终得到了相似的地址,例如: 名称
圣皮兰斯
英国伯克郡圣皮兰斯学校
英国伯克郡圣皮兰斯
圣斯科拉西卡的
圣学校大学
圣舍贝拉大学格莱布学院

他们都是同一所学校。有没有一种基于相似性将它们分组的方法。 将每个字符串与列表中的另一个字符串进行比较,并根据相似性对其进行分组

因此,所需的输出将是:

名称类别 圣皮兰斯1 英国伯克郡,圣皮兰斯学校1 英国伯克郡,圣皮兰斯1 圣斯科拉西卡2 圣舍拉卡纳学院2 圣舍贝拉学院的格列布2

请提出在使用R还是Python时是否更好,并建议我解决这两个问题的代码/方法。

非常感谢!

0 个答案:

没有答案