pandas和fuzzywuzzy匹配百分比不正确

时间:2016-04-18 18:06:23

标签: python pandas fuzzywuzzy

我正在尝试使用fuzzywuzzy列进行列匹配。

我的代码是:

merged_file['ratio']=fuzz.ratio(merged_file.iloc[:,7], merged_file.iloc[:,33])

无论我尝试从1列到另一列匹配,但每列的比率始终相同。 例如

Here is the sample data set

上面应该是0,100,100和0,100,100

1 个答案:

答案 0 :(得分:1)

试试这个:

merged_file['ratio'] = [fuzz.ratio(a, b) 
                        for a, b in zip(merged_file.iloc[:,7], merged_file.iloc[:,33])]

它使用列表推导来计算两列中每对变量的fuzz.ratio。 ab只是临时变量,只存在于列表推导范围内。