寻找像Lucene这样的东西,用于树中使用的关键字索引

时间:2014-06-28 00:36:24

标签: search tree lucene full-text-search

我一直在寻找一个开源项目(如Apache Lucene)来在索引对象列表上执行以下功能(具有文本标题和相关关键字列表等属性):

  1. 对两个关键字&进行搜索标题全文
  2. 创建排名的关键字树(基于关键字的出现次数)。例如,所有对象的前10个关键字显示在顶层,然后选择关键字,您会看到与该关键字关联的顶级关键字列表等。
  3. 我的想法是使用Apache Lucene,它提供了一种很好的方式来进行全文和关键字搜索,但我不能100%确定这将如何转换为创建排名关键字树。我可能遗失的任何其他产品?

1 个答案:

答案 0 :(得分:1)

排名关键字问题可能会通过分面优雅地解决。假设foo字段中的10个文档中有keyword,同一字段中的5个文档中出现bar。然后在keyword字段上进行分面将为foo提供10,为bar提供5。

您可以在此处找到一个记录良好的示例:http://lucene.apache.org/core/4_0_0/facet/org/apache/lucene/facet/doc-files/userguide.html