标签: python arrays numpy fuzzy-search
我遇到了一个问题,这个问题源于尝试根据字符串配对数组。基本上,我有一个棒球运动员名单及其相关统计数据。我发现的是,各个网站对同一个玩家使用不同的拼写,即" Steve" vs"斯蒂芬。"显然,这会在纯搜索函数中抛出一个循环。
有了这个说法,我正在考虑使用Levenshtein Python extension和C库。但是,我不确定如何以有效的方式实现它。从理论上讲,我可以遍历基本列表中每个名称的整个列表,但这是最后的选择。难道没有更好的方法吗?