我想运行Levenshtein,但速度更快,因为它是我正在构建的实时应用程序。它可以在距离大于10时终止。
答案 0 :(得分:7)
从评论来看,人们似乎对Sift3非常满意。
答案 1 :(得分:2)
Levenshtein distance指标允许添加,删除或替换操作。如果您正在寻找更快但不太精确的指标,则可以使用the longest common subsequence(仅允许添加和删除),甚至Hamming distance(仅允许替换)。
但是,我建议您尝试优化Levenshtein距离算法,因为它可以提供最佳效果。
答案 2 :(得分:0)
如果您想比较UTF-8内容,请使用sift4
:
http://siderite.blogspot.com/2014/11/super-fast-and-accurate-string-distance.html
我还准备了一个jsPerf来显示这些库之间的性能差异:http://jsperf.com/levenshtein-perf