使用BooleanQuery还是写更多索引?

时间:2012-05-05 17:41:21

标签: java lucene.net lucene

像这样的类别树:

root_1
  sub_1
  sub_2
  ... to sub_20 

每个文档都有一个子类别(如sub_2)。现在,我只在lucene索引中写了sub_2

new NumericField("category",...).setIntValue(sub_2.getID());

我希望使用root_1(将BooleanQuery合并到sub_1)获取所有sub_20个文档,以便在每个条目文档中搜索或编写其他类别:

new NumericField("category",...).setIntValue(sub_2.getID());
new NumericField("category",...).setIntValue(root_1.getID());//sub_2's ancestor category

哪个是更好的选择?

1 个答案:

答案 0 :(得分:2)

我会使用路径枚举/'Dewey Decimal'表示类别层次结构。也就是说,不是仅存储第一个根的第二个子节点的“sub_2”,而是存储类似“001.002”的内容。

要查找根及其所有子项,您可以搜索“ category:001 * ”。

要仅查找根的子项,您可以搜索“ category:001。* ”。

(另请参阅How to store tree data in a Lucene/Solr/Elasticsearch index or a NoSQL db?。)