搜索相关性的最佳做法?

时间:2013-10-29 00:16:20

标签: java database search servlets

我正在创建一个处理用户搜索查询的java servlet。 搜索范围在文档列表中(所有文档都有标题和消息)。在按相关性搜索时,我应该采取什么方法来优先考虑?我想我要求一些关于良好搜索/检查的提示。 现在,我只是将查询作为字符串,并且servlet检查字符串是否包含在标题或消息中。 任何提示表示赞赏

1 个答案:

答案 0 :(得分:1)

假设我告诉你,我会做以下事情:

如果搜索字符串中包含至少一个字词,则会在搜索中显示一篇文章。为搜索中显示的每篇文章指定相关性分数,将其初始化为0,然后根据特定条件应用权重。

例如:

  

标题包含搜索中的所有单词(按不同顺序):+ 15

     

标题包含完全字符串:+200

     

文章包含搜索中的一个词:+5(+ 5更多   每增加一个单词)。

     

文章包含完全字符串:+100