从python中的numpy数组进行模糊字符串比较

时间:2014-04-30 01:32:46

标签: python arrays numpy fuzzy-search

我遇到了一个问题,这个问题源于尝试根据字符串配对数组。基本上,我有一个棒球运动员名单及其相关统计数据。我发现的是,各个网站对同一个玩家使用不同的拼写,即" Steve" vs"斯蒂芬。"显然,这会在纯搜索函数中抛出一个循环。

有了这个说法,我正在考虑使用Levenshtein Python extension和C库。但是,我不确定如何以有效的方式实现它。从理论上讲,我可以遍历基本列表中每个名称的整个列表,但这是最后的选择。难道没有更好的方法吗?

0 个答案:

没有答案