像这样的类别树:
root_1
sub_1
sub_2
... to sub_20
每个文档都有一个子类别(如sub_2
)。现在,我只在lucene索引中写了sub_2
:
new NumericField("category",...).setIntValue(sub_2.getID());
我希望使用root_1
(将BooleanQuery
合并到sub_1
)获取所有sub_20
个文档,以便在每个条目文档中搜索或编写其他类别:
new NumericField("category",...).setIntValue(sub_2.getID());
new NumericField("category",...).setIntValue(root_1.getID());//sub_2's ancestor category
哪个是更好的选择?
答案 0 :(得分:2)
我会使用路径枚举/'Dewey Decimal'表示类别层次结构。也就是说,不是仅存储第一个根的第二个子节点的“sub_2”,而是存储类似“001.002”的内容。
要查找根及其所有子项,您可以搜索“ category:001 * ”。
要仅查找根的子项,您可以搜索“ category:001。* ”。
(另请参阅How to store tree data in a Lucene/Solr/Elasticsearch index or a NoSQL db?。)