我正在寻找模糊substring
函数的方法。我是什么意思:
示例1:
这是完全匹配,应该得分1.0。
示例2:
这是模糊匹配,因为“weed”和“destroyed”出现在文本中,但没有“将会”。它应该得到一个高分(比如0.8)。
示例3:
如果我们将“短”设置为“被破坏的将是杂草”,虽然“破坏”和“杂草”都出现在原始文本中,但分数应该非常低,因为它们的顺序已经改变。
对此有何建议?
最后一点是,没有独特的方法来做这个得分。但我正在寻找AN算法。可以根据需要和要求调整该算法的参数。
答案 0 :(得分:2)
这是一种可行的方法:
答案 1 :(得分:2)