我已经知道javascript中的许多编辑距离算法实现,但我想基于它来计算文本相似度的百分比。有谁知道如何实现它?
答案 0 :(得分:0)
您必须找到长度为n
的字符串与长度为m
的字符串之间的最大可能距离。例如,如果此最大距离为n + m
,则百分比将为
100 - 100 * edit_distance(a, b) / (a.length + b.length)
例如,如果您使用Levenshtein距离,其中每个插入,替换,删除的成本为1
,则此最大可能距离为max(n, m)
,因此百分比将为
100 - 100 * Levenshtein(a, b) / Math.max(a.length, b.length)