python Fuzzywuzzy限制,它如何工作?

时间:2018-10-17 18:25:48

标签: python-3.x fuzzy-logic fuzzy fuzzywuzzy

该限制如何与python Fuzzywuzzy模块一起使用,这是什么意思?

matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)

1 个答案:

答案 0 :(得分:1)

当您需要“ x”个最佳匹配解决方案时,限制通常用于Fuzzywuzzy。

因此,例如,您正在比较df的同一列以相互匹配。第一次匹配将是名称本身。因此,您limit = 2确实获得了第二名。

Ex: column values =['Apple','Banana','Orange','Appl','Banan']

如果您想使用同一列进行模糊处理,并查看由于拼写错误等原因在不同的上下文中如何使用“ Apple”。现在,Apple的最佳匹配将是Apple本身,因此您limit=2会得到在这种情况下为“ 应用

我希望我很清楚