使用数字值进行字符串相似性检查

时间:2018-10-30 10:23:50

标签: string string-comparison similarity

我想知道计算数字的最佳方法是什么 字符串的表示形式,以使相似的字符串具有相似的表示形式/数值。例如:“ ABCDE”-> 80759,“ ABCDF”-> 80763,但应避免以下情况:ZBCDE-> 2680805,ABCDE-> 180805或:ZBCD-> 268080,ZBCDE-> 2680805,其中更改时数字会大不相同只是一个字母或当一个字母被放下时,除此之外,字符串非常接近/匹配。

请注意:我不想使用Levenshtein Distance或以某种方式比较两个字符串,而是要为一个相似或至少不会急剧变化的字符串计算一个代表数字如果两个原始字符串都相似,则为另一个字符串生成的数字。我希望这个数字尽可能小。

谢谢!

0 个答案:

没有答案