如何使用正则表达式对列表中的相似或非常相似的项进行分组

时间:2016-05-08 13:57:40

标签: regex python-2.7

想从另一个包含较大列表中相似项目的较大列表中创建一个新列表。我的较大列表包含值[埃弗顿,QPR,阿森纳,伊夫顿,曼彻斯特,莱斯特,莱克斯特..等等]

想要找到一种方法来创建包含上述列表中大部分相似项目的新列表,使用正则表达式.Everton和Eveton应该包含在新列表中,因为它们大致相似。

没有代码,因为我不知道如何进行这样的操作

由于

1 个答案:

答案 0 :(得分:0)

您想使用"edit distance"算法。其中有一堆,但一个常见的“教科书”是Levenshtein's

当然有一些Python库,还有一个相关问题,答案如下:Edit Distance in Python