我目前正在使用fuzzy_matcher库,并已通过链接各种记录对其进行了测试。
但是我不知道得分系统。
我以前使用过更流行的fuzzy wuzzy
库,该库的相似度在0到100之间,并且易于自动执行阈值截止。
使用fuzzy matcher
库,相似度分数包括负数,而我的Google-fu无法找出分数的范围。
例如,我的相似性得分可能从-0.78
到1.9
。
我进行的另一项测试的得分从-0.7
到1.15
。
有人识别这种计分系统吗?是从负2到正2?如果我不知道最高或最低分数,我将无法自动执行阈值截止。