该限制如何与python Fuzzywuzzy模块一起使用,这是什么意思?
matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)
答案 0 :(得分:1)
当您需要“ x”个最佳匹配解决方案时,限制通常用于Fuzzywuzzy。
因此,例如,您正在比较df的同一列以相互匹配。第一次匹配将是名称本身。因此,您limit = 2
确实获得了第二名。
Ex: column values =['Apple','Banana','Orange','Appl','Banan']
如果您想使用同一列进行模糊处理,并查看由于拼写错误等原因在不同的上下文中如何使用“ Apple”。现在,Apple的最佳匹配将是Apple本身,因此您limit=2
会得到在这种情况下为“ 应用”
我希望我很清楚