我有一个文章名称列表,这些文章名称是字符串,并且基于用户查询,我需要从文章名称列表中输出最佳搜索。我在考虑什么样的算法可以在这里工作。应该建议最接近的匹配,IMO。还是有一种更好的方式让我记住吗?
答案 0 :(得分:1)
您可以尝试使用容差值为 n 的 edit distance 算法(绝对值或百分比值),以使结果在范围内例如,在大多数情况下,一篇文章的查询编辑距离超过50%,其长度可能超出范围。接下来,您可以按结果与查询字符串的百分比编辑距离对结果进行排序,以使完全匹配为100%匹配,名称与查询类似99%的文章排名为99%相似,依此类推。
答案 1 :(得分:1)
查看Lucine。这是一种流行的文本搜索开源解决方案。它可能会节省您的时间,防止您重新发明轮子。