想从另一个包含较大列表中相似项目的较大列表中创建一个新列表。我的较大列表包含值[埃弗顿,QPR,阿森纳,伊夫顿,曼彻斯特,莱斯特,莱克斯特..等等]
想要找到一种方法来创建包含上述列表中大部分相似项目的新列表,使用正则表达式.Everton和Eveton应该包含在新列表中,因为它们大致相似。
没有代码,因为我不知道如何进行这样的操作
由于
答案 0 :(得分:0)
您想使用"edit distance"算法。其中有一堆,但一个常见的“教科书”是Levenshtein's。
当然有一些Python库,还有一个相关问题,答案如下:Edit Distance in Python