使用lucene识别最相关的文档

时间:2014-04-30 02:49:48

标签: java search lucene relevance

我正在尝试解决以下搜索问题。假设我们有10个不同的文件d1..d10 每个文档包含一种数据,例如,d1 - >电影名称列表,d2 - >演员姓名列表,d3 - >地址列表等。每个文档包含实体和分数列表。因此d1包含电影名称及其受欢迎程度等。假设分数都已归一化(文档中的0-max_score)

现在给出一个搜索查询(短语),我想根据与搜索短语的相关程度对10个文档进行评分。

我的问题是,使用lucene是一种很好的方法吗?我计划将每个短语的分数索引到lucene中的单独文档中,然后查询最匹配的内容。

我不想搜索单个实体。我可以获得给定搜索短语的实体类型的所有分数。例如,如果有人搜索戒指的主人,我需要能够说它很可能是电影而不是演员或地址。我的目标是最小化空间消耗并优化性能

0 个答案:

没有答案