应用错误收集

我正在尝试解决以下搜索问题。假设我们有10个不同的文件d1..d10 每个文档包含一种数据，例如，d1 - ＆gt;电影名称列表，d2 - ＆gt;演员姓名列表，d3 - ＆gt;地址列表等。每个文档包含实体和分数列表。因此d1包含电影名称及其受欢迎程度等。假设分数都已归一化（文档中的0-max_score）

现在给出一个搜索查询（短语），我想根据与搜索短语的相关程度对10个文档进行评分。

我的问题是，使用lucene是一种很好的方法吗？我计划将每个短语的分数索引到lucene中的单独文档中，然后查询最匹配的内容。

我不想搜索单个实体。我可以获得给定搜索短语的实体类型的所有分数。例如，如果有人搜索戒指的主人，我需要能够说它很可能是电影而不是演员或地址。我的目标是最小化空间消耗并优化性能

使用lucene识别最相关的文档

0 个答案: