Lucene是否使用扩展布尔模型检索?

时间:2011-09-07 23:22:07

标签: lucene information-retrieval

前段时间我遇到了extended boolean model,它结合了布尔检索逻辑和与矢量空间模型类似的方式对文档进行排名的能力。

据我所知,这正是Lucene在排名文档方面的工作方式。我是对的吗?

1 个答案:

答案 0 :(得分:1)

它是向量空间模型和布尔模型的组合。查看Scoring文档页面:

  

Lucene评分使用信息检索的向量空间模型(VSM)和布尔模型的组合来确定给定文档与用户查询的相关程度。通常,VSM背后的想法是,相对于该术语在集合中的所有文档中出现的次数,查询术语在文档中出现的次数越多,该文档与查询的相关性就越高。它使用布尔模型首先根据查询规范中布尔逻辑的使用来缩小需要评分的文档。

如果您将Similarity的公式与经典VSM formula进行比较,您会注意到它们相似(尽管不相同)。