基于编辑距离的百分比javascript文本相似度算法

时间:2015-02-15 20:43:15

标签: javascript text similarity

我已经知道javascript中的许多编辑距离算法实现,但我想基于它来计算文本相似度的百分比。有谁知道如何实现它?

1 个答案:

答案 0 :(得分:0)

您必须找到长度为n的字符串与长度为m的字符串之间的最大可能距离。例如,如果此最大距离为n + m,则百分比将为

100 - 100 * edit_distance(a, b) / (a.length + b.length)

例如,如果您使用Levenshtein距离,其中每个插入,替换,删除的成本为1,则此最大可能距离为max(n, m),因此百分比将为

100 - 100 * Levenshtein(a, b) / Math.max(a.length, b.length)